语音识别
1.什么是语言识别[1]
语言识别是指计算机用有限的特征或规则对我们日常生活中使用的语言符号进行运算,以辨认出它们是哪些字或词的过程。
2.语言识别的发展
语言识别的研究始于本世纪五十年代。开始时人们认识简单,语声既然有共振峰,在接收系统中设若干组共振线路,某一组输出最大时就可判断为某一语声。但事实上并非如此简单。这是因为一人在不同时间不同条件下,语言特征可能有相当大的变化,不同的人出入更大。当时识别装置只能识别特定某人的少数几个语言如0—9的数字。到70年代,由于电子计算机和计算技术的发展,这方面工作又活跃起来,至今研究的范围已扩展到连续语言,大词汇量,非特定人的范围。但要做出一个这样的实用系统,技术发展似乎还不够,需要更深入地了解人的语言产生机理和感知理论,及语言学中句法分析和语义分析等。
3.语言识别的分类
语言识别可根据词汇大小,讲活人范围,发音方式和环境等情况分作很多类。例如:
1、词汇量大小
可分词汇量小(1~20个词),中等(20~l00个词),大(100词以上);
2、讲话人范围
分特定某个人、某些人;非特定的,男、女或儿童等;
3、发音方式
孤立字发音,连续发音;
4、讲话环境
例如隔声问、机房、公共场所;
5、系统学习方式
不学习,离线学习,不断地学习。
可见对语言识别系统的要求可以有很大的出入,因此系统的规模、大小、复杂性等出入也很大。
4.语言识别的应用
1、语言打字机
现在微计算机已普遍应用,多种文字的输入、输出,打印非常成功。如果装上口语输入设备,就可实现语言打字机等,将人们从手指操作中解放出来。
2、控制机器人
利用有限词汇的语音识别系统就能达到声控机器人的目的。例如在机器人搬运重物的场合,如果给机器人接上语音识别器,使机器人能听懂诸如“向前”、“左转”、“右转”、“提起”、“放下”等一些有关的命令,那么人们可以坐在一边,用口令控制机器人完成重物的搬运。