《基于Matlab的语音识别系统的设计》修改意见稿
1、“.....递推计算河南理工大学毕业设计论文说明书,整体概率后向概率用表示,其意义为系统在时刻处于状态下,已经存在从到刻的观察矢量的情况下,又出现的概率。考察时刻,计算的是出现的概率,而实际系统不存在,是空集,因此有初始条件。后向概率的具体计算算法如下初始化递推计算,在定义了前向概率以及后向概率及其计算方法以后,考察整体概率,即出现整个观察矢量序列,的概率事实上,上述公式和系统当前所处的时刻无关,用公式代入有即系统在模型下名出现观察序列的概率是唯的。在时刻,因为有河南理工大学毕业设计论文说明书在时刻......”。
2、“.....外界观察到的个矢量序列在系统内部其对应的状态序列是不唯的,但是不同的产生的可能性不样。状态序列搜索的任务就是根据系统输出搜索最有可能的状态序列,使得该状态序列产生的可能性达到最大。对于个搜索系统内部对应的最有可能的状态序列,可以表示为在已知当前系统模型以及下产生的条件后验概率,,并使得该概率达到最大,有上式中,分母项对于所有的状态序列都相同,因此可以简化成比较其中的分子,即。对于所有可能的,直接计算上述概率并选择其中的最大者,计算量很大。为此可以采用种递推的算法,搜索算法即可以很好的解决这个问题。假设系统的观察矢量序列,要求条状态序列,使得下面的概率达到最大,假设系统在时刻处于状态,而先前时刻的状态为。可以任意选择,则可以找到条从到的路径,使得产生输出序列的概率达到最大。假设此概率最大值记为,有......”。
3、“.....为了描述路径节点之间的递推关系,定义其意义为的条最优路径中的状态序号。则求最优状态序列的搜索算法如下初始化,递推计算河南理工大学毕业设计论文说明书对于,由求,并求出确定对求的最大值,其相应的值即是整条最优状态序列的最后个状态所取的状态的下标序号,记为,有路径回溯由出发进行回溯求出最优状态序列路径问题模型训练重估算法假设训练前模型参数为,训练后模型参数变为。令,表示系统在时刻位于状态,而在时刻位于状态并产生观察矢量序列的概率,有,令表示系统在时刻位于状态并有观察矢量序列的概率,有,......”。
4、“.....事实上,和,存在以,。将,对所有的时刻求和,其意义表示系统从所有时刻的状态转移到状态并产生观察矢量序列的概率总和,记为,有,同样,将以对所有的时刻求和,其意义表示系统从所有时刻的状态转移并产生观察矢量序列的概率总和,记为,有的估计假设为初始状态概率矢量的新估计,其中元素可以用时刻系统位于状态并又观察矢量序列的概率来表示,有,的估计假设表示由转移到的概率的新估计,其计算方法可以表示为由状态转移到状态的概率总和由发生状态转移的概率总和。系统从所有时刻的状态转移到状态并产生观察矢量序列的概率总和由河南理工大学毕业设计论文说明书给出......”。
5、“.....因此有的估计在离散模型下,系统的观察矢量为系列的离散值,概率分布函数矢量为矩阵,其中表示系统位于状态并观察到码字,为观察矢量的维数,为第维元素的概率。假设为的新估计,则,使用上述方法迭代,可以逐步调整系统模型参数,以使得模型产生观察矢量序列的概率不断增加并达到个极大点。但是该方法的训练结果与初值相关,可能收敛不到全局的最优解,因此采用种分段足均值算法可以较好的解决这个问题,如图所示。图分段均值算法进行模型参数训练当然,分段均值算法仍然需要基于初始模型参数进行计算。初始模型的产生有两种主要方法,种是采取均匀分布或随机设置的方法,另种方法是将训练语音的数据根据模型的状态数按照种规则分段,每段作为状态的训练数据,从而计算模型的初始参数......”。
6、“.....而与以往任何时刻的状态无关。输出值的马尔可夫假设在时输出观测值的概率,只取决于当前时刻所处的状态,而与以前的历史无关。事实上这两种假设并不十分合理,因为任意时刻出现的观测输出矢量概率依赖于系统当前所处的状态,而且依赖于系统在前时刻所处的状态。为了弥补这缺点,对经典的模型的状态转移和输出观测值的马尔可夫假设条件做定的改进,并导出新模型的前向和后向算法。假设隐藏的状态序列是个二阶马尔可夫链在时刻的状态向时刻的状态转移的状态转移概率不仅依赖于时刻的状态,而且依赖于时刻的状态,即,其中,。表示模型中状态个数。同样特征观测矢量的概率不仅依赖于系统当前所处的状态,而且依赖于系统前时刻所处的状态,即改进的前向后向算法是在计算在给定模型的条件下产生观测序列,的概率,即。由式可知给定模型,产生状态序列......”。
7、“.....表示状态,的概率。由式可得,在该状态序列条件下模型已经给定产生观测序列的概率所以在给定模型下产生给定序列的概率,按上式直接计算,其运算量非常大。为使问题求解变得更加实际,需寻求更为简介的方法。前向算法的改进河南理工大学毕业设计论文说明书首先定义前向变量,,它参数到结构数组中。参数初始化输入为的数组,为状态数,是每个状态包含的高斯混合个数。前向后向概率识别算法输入模型和参数,回溯最佳状态路径,返回输出概率和状态路径。河南理工大学毕业设计论文说明书训练过程对次迭代函数实施次迭代设置迭代次数。输出为训练后的模型参数和总输出概率,将模型参数存入为个数组。识别程序对输入待识别的语音用函数进行端点检测,计算出参数之后,交由识别函数计算得到其对数形式的输出概率,最后用函数找到识别结果。实验结论分析通过实验的探索......”。
8、“.....通过对其附带的各工具箱的使用,及的快速实时开发,结合自由的程序编写,使得些原本复杂的数据处理过程变得快捷简便,大大提高了实验的可操作性能。提供的强大的实时处理能力是信号处理特别是语音识别所梦寐以求的,结合软件提供的各类软硬件接口和高级语言编写环境,为该识别系统的展开提供了可靠的软硬件支持,展示了平台在语音识别领域广阔的应用前景。采用编写图形界面,实现语音的录入端点检测特征提取模板训练和语音再录入识别。创建包含个数字组成的汉语语音数据库,对每个数字语音分别建立个状态,每个状态含个高斯概率密度函数的模型。训练过程对模型参数进行最多次的迭代计算,直到收敛。实验表明,对不同的数字语音训练时间在,识别时间为。对孤立汉语数字语音进行识别,识别结果如表识别数字识别正确率表汉字语音识别结果从表中可以看出孤立词语音的识别效果比较好。在笔者基于环境下实现的初步孤立词语音识别设计中的算法方面,采用更为完善但同时更复杂的隐马尔科夫模型等提高辨识的准确率。这些都对未来的研究方向提出了可行的切入点......”。
9、“.....语音的采样频率采用,采样,帧长为,帧移为,训练人数为,采样样本为男女各个人的数码语音资料,男女分用套不同参数训练系统中当概率的相对变化值小到定数值设定为或迭代次数超过时,结束迭代。实验表明,系统达到了较好的实时性和较高的识别率。河南理工大学毕业设计论文说明书由于功能强大,在处理中可直接利用许多现成的函数,编程方便,结果可视化也容易实现。六结束语回顾本论文主要是基于语音信号分析的基础上介绍了语音识别的五种识别算法动态时间伸缩算法,基于规则的人工智能方法人工神经网络,方法隐马尔可夫,方法和的混合模型。其中重点是对算法展开研究和讨论,包括的数学描述三个基本问题结构和类型。采用模型的算法是当前语音识别的主要方法,它保留了更多训练数据的统计信息,从而保证了识别语音音段特征的准确性,很好的解决了分类以及训练上的困难,维特比束搜索语音识别算法解决了时间轴的归化问题,从而成为较为成功的算法。在经典的模型中有两个重要的假设,而这两种假设并不十分合理......”。