单呼言语识别又称孤立词模式识别。言语识别的方式之一。在正式作业之前,发音人逐个地朗读待识别的词汇,计算机经过逐帧分析,提取出某些特征(如频谱包络、共振峰、LPC系数等),制成一组组样板贮存备用。这就是所谓训练或学习阶段。使用时,说话人说出某一词,计算机经过分析和提取特征,逐一与库存样板作比较,选出一组匹配最好的,判为所说的词。发音人发音时,每个识别单位必须停顿一下,停顿时间一般要求在100~150毫秒之间,每个识别单位内部不允许有短于100毫秒的间隔。这种系统识别的词汇量一般只有10~1000个,此外,这种方式一般认为是认人的,能以较高的识别率(一般都在95%以上)识别出训练它的人所说的词,如果换了人,识别率明显下降。目前,孤立词识别装置已开始应用于产品质量的检验和记录、邮件分类、电话查询等场所。
|