帮帮文库

返回

连续语音识别中半连续HMM的研究及实现硕士学位论文 连续语音识别中半连续HMM的研究及实现硕士学位论文

格式:word 上传:2022-06-24 19:07:08

《连续语音识别中半连续HMM的研究及实现硕士学位论文》修改意见稿

1、“.....人们常常从不同的角度对识别系统进行分类按说话方式及语言规则孤立词识别被识别的基本单位的语音之间有明显的停顿间隔。这种系统的识别正确率最高,但输入语音速度较慢,而且使用者常常感到语音输入方式不自然连接词识别被识别的基本单位的语音可连续输入而不必停顿,同时对输入的基本单位的顺序没有限制。如象电话号码这样的数字串就可用连接词识别法。它的缺点是应用范围不广,而且识别正确率较低。连续语音识别被识别的基本单位的语音可连续输入而不必停顿,同时对输入的基本单位的顺序有语法语义上的限制。连续语音的输入方式比较接近自然,输入语音速度较快,但识别正确率远远低于对孤立词和连接词的识别。二〇〇二年五月七日星期二自然口语识别可以看作种更高级的连续语音输入方式。说话者完全用自己习惯的自然方式输入语音。语音完全口语化语音可以随意地连续停顿和快慢变化,可以有无关的内容如咂嘴的声音嗯„„等......”

2、“.....噢,四四房间,语法上没有书面语那样较严格的限制。自然口语识别是语音识别的最高阶段,也是现在的个研究热点。尽管这四种语音输入方式有或多或少的区别,但实际系统常常包含了许多相同或相似的模块和算法。如语音信号预处理部分有时可以通用于这四种系统,这四种系统可以使用相同的声学模型,连续语音系统和自然口语系统也可以共享些语言后处理的算法,等等。按词汇量大小小词汇量识别可识别词数少于个中词汇量识别可识别词数大于但小于个大词汇量识别可识别词数大于个。随着词汇量的增加,在特征空间中相邻词的距离减小了,而词与词交叉重叠的机会增大,所以识别也越困难。按被识别人范围特定人识别语音识别系统专门为特定人定制,当对这个人进行语音识别时,系统可达到定令人满意的识别正确率非特定人识别系统可以对所有人的语音产生较好的识别结果。实际上,许多非特定人的识别系统都具有自适应功能......”

3、“.....以对这个人达到更好的识别效果,这样非特定人似乎就变成了特定人识别系统。所以非特定人系统和特定人系统往往没有个绝对的界限。语音识别的应用价值语音识别有极其巨大的应用价值,这主要表现在以下几方面种非常自然的文字输入方法二〇〇二年五月七日星期二人类希望将自己的语言记录下来,传统上可以通过书写等物理手段进行具体的保留。现在,更准确可靠和容易加工的手段是输入计算机以抽象数据编码的形式进行记录。最常用的方式是用键盘输入,这要求使用者必须经过专门的训练,而对普通用户又不太现实。尤其对于使用汉语的中国人的来说,困难就更大,因为汉字是象形文字,不象英语等拼音文字那样每个字母都有键盘按键直接对应。虽然现在汉语已有五笔字型等高效输入编码方式,但对于般人来说很难熟练掌握。另方面,口语是人类生存的个重要手段,虽然它不是与生俱来的,但个健康人在他的早年即已习得......”

4、“.....有时,书写也可以作为人们的交流方式,不幸的是书写速度还是比普通的说话速度慢,所以口语应该成为最自然快速的文字输入方式。语音控制在很多场合下,人们希望有手动控制以外的控制方式。有时是为了安全,比如在驾驶车辆时,司机为了使用移动电话,分散精力用手拨号就是很危险的有时是为了方便,比如现在的掌上电脑体积很小,用普通电脑的按键方式使用很困难还有时是特殊环境的要求,比如我们在黑暗的场所操纵诸多开关按钮时,会发现并不容易。而语音在这些方面却不受限制,我们可以用语音识别进行拨号,进行掌上机的输入,进行开关的控制。语音控制可以解放我们的双手,帮助我们克服各种操作的困难,还可以使我们的生活工作更方便和舒适。比如在联网的智能家电中装上语音识别模块,我们就可以从办公室打电话了解家里的情况,并控制家电的工作。另外,对残疾人来说,语音控制可能会使他们能像健康人样地自理生活。总之,语音控制的应用前景非常广阔......”

5、“.....天气查询等将语音识别自然语言理解对话控制语言生成语音合成数据库等技术综合起来可以构成对话系统。对话系统现在已开始用于订票系统,普通用户可以通过电话进行语音订票或预定旅馆房间另外还出现了带有对话系统的天气查询系统,用户同样可以通过普通电话进行语音查询。对话系统可以在任何时候被大负荷的访问,不象人样会疲劳,总能给用户亲切快捷的服务。预计语音识别在这方面的应用还要进步扩大。口语翻译系统随着人们的交流日益频繁,对口语翻译的需求越来越大。为此很多机构在二〇〇二年五月七日星期二研究自动口语翻译系统。口语翻译的第步就是要听清用户在说什么,这部分的工作离不开语音识别系统。计算机辅助教学在常规的课堂教学中,老师和学生之间经常要进行交流,以提高教学的质量,解前状态贡献最大的前个码本按权重系数从大到小的排序,可以看出,这些码本的权重系数同表些码本相比是很大的......”

6、“.....我们可以简单地设定每个状态只采用个码本表示,对于有个码本的状态,设权重系数为,,首先我们对码本系数进行排序,假设排序结果为二〇〇二年五月七日星期二,抛弃的那些码本,为了保证剩余的个码本系数是归化的,我们再对这个码本系数做归化处理。即ˆ经过这样的处理后,每个状态的码本组合数由原来的减少到,大大减少了计算量,通常可以为的。表码本剪枝的实验码本数耗时秒识别率表是码本剪枝策略的测试结果。实验的系统全部码本数为,这个码本被系统的所有模型和所有状态共享,实验中我们把码本的共享数从降到。从实验数据可以看出,采用不同的码本组合数,所花费的计算代价显著不同,当状态的码本数从个码本降到个码本时,搜索速度提高了接近十倍,而识别率却没有降低。这说明码本剪枝策略对提高搜索速度的贡献是相当大的。剪枝策略在搜索过程中......”

7、“.....在当前时刻,要计算状态空间中所有状态对当前帧产生的似然值。实际上,有些状态从前时刻获得的累计似然得分很小,它们在后续时间里是没有竞争力的,因此对这些状态的当前似然值可以不做计算,从而减少状态计算的数量,提高搜索速度。图是搜索的示意图,它是无跨越由左向右的,图中只给出了部分跳转情况,我们分析当时状态的跳转及剪枝的可能。对于的每个状态,它的累计似然得分只能来自时刻的两个状态,个是来自于它自身的状态例如,另外个如果该状态是模型的首状态,似然得分可能来自其它模型的末状态例如,如果该状态不是模型的首状态,它的似然得分可能来自自身模型的上个状态例如,最终的得分是取这两个似然得分最大的个作为本状态从前时刻继承来的累计得分。如果这二〇〇二年五月七日星期二个得分足够小,那么就没有必要计算当前帧在当前状态的概率,因为这个状态是没有竞争力的,也就是说它是最佳路径的可能性很小,因而可以抛弃......”

8、“.....由于减少了状态概率的计算,相应地提高了搜索的速度。得分足够小的标准是相对而言的,对于时刻我们可以计算出所有状态从前状态继承来的似然得分,表示状态空间所有状态,从中选择最大者作为基准,设为,另外定义个阈值,如果成立,则抛弃状态。不计算它在当前帧的概率,否则计算它在当前帧的概率并和时刻继承来的得分相乘在对数域是相加作为本状态新的似然得分。表剪枝的实验宽度耗时秒识别率表是剪枝的实验结果,的宽度由降到,可以看出当的宽度大于时,花费的时间基本相当,说明没有剪枝或剪枝很少,当的宽度小于时,剪枝的作用有所表现。随着宽度的减少,所花费的时间也在降低,但降低的幅度不大。究其原因,方面是我们采用了与上下文无关的无调音节作为识别基元,它的模型数和状态空间相对较小,能够剪枝的状态帧数图二〇〇二年五月七日星期二范围有限,因此剪枝的作用表现不明显。另方面......”

9、“.....它的码本是全局共享的,即使对个状态进行了剪枝,属于该状态每个码本的当前似然值也必须计算,因为这些码本还用于其它的状态。实际上,在中,剪枝的作用仅仅是节省了码本线性组合时的些乘加计算,由于已经采用了码本剪枝的策略,相应地削弱了剪枝的作用。同时我们注意到剪枝的风险很大,它是在算法基础上形成的个更次优算法,如果的宽度设置不合适,些最优或次优的路径有可能在搜索的早期即被截断,且无法补救。因此在采用剪枝时,宽度不宜选得过小。对我们的系统而言,宽度选在之间是合适的。由于不同系统实现的方法可能不同,计算出的似然得分也不尽相同,这个宽度只具有参考价值。降低精度策略由于连续语音训练的复杂性及容易溢出,同时也为了使训练模型的参数更加精确,在训练阶段,我们全面地采用了双精度型参与运算,模型参数也用双精度型来表示。它的缺点是显而易见的,双精度型使得硬盘存储及内存消耗成倍地增加......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(1)
1 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(2)
2 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(3)
3 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(4)
4 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(5)
5 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(6)
6 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(7)
7 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(8)
8 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(9)
9 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(10)
10 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(11)
11 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(12)
12 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(13)
13 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(14)
14 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(15)
15 页 / 共 71
预览结束,还剩 56 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档