1、“..... 经过几十年的努力,语音信号处理在语音识别语音增强语音编码说话 人识别说话人情感识别语音合成等方面取得了巨大的进步,然而,旦这些 技术应用在实际环境中,由于环境噪声信道等方面的影响,性能急剧下降,因 为在实际环境中没有完全纯净的语音信号,般都会伴有噪声或其它干扰语 音检测的任务就是判断待处理信号是语音还是非语音,从输入信号中找到语音部 分的起止点。语音检测是语音识别语音增强以及语音编码等中的个重要环节。方式。境下的语音端点检测仍存在定的差 距,它的准确性很大程度上直接影响着后续的工作能否有效进行,如何准确地检 测出带噪语音的端点至今仍是个难题。 研究背景及意义 语音是语言的声学表现形式,语言是人类特有的功能,声音是人类常用的信 息交流工具,通过声音传递信息是人类最重要最有效最准确最方便最自 然的信息交换的方式......”。
2、“.....包含计算机 科学语音学语言学声学生理学 研究背景及意义 语音是语言的声学表现形式,语言是人类特有的功能,声音是人类常用的信 息交流工具,通过声音传递信息是人类最重要最有效最准确最方便最自 然的信息交换的 境下的语音端点检测仍存在定的差 距,它的准确性很大程度上直接影响着后续的工作能否有效进行,如何准确地检 测出带噪语音的端点至今仍是个难题。部分内容简介入和环境的改变通常会使系统性能显著下降。研究表明,即使在安 静的环境中,语音识别系统半以上的识别来自端点检测器。因此,作为语 音识别系统的第步,端点检测的关键性不容忽视,尤其是噪声环境下语音的端 点检测,实验室的研究结果与复杂的实用环境下的语音端点检测仍存在定的差 距,它的准确性很大程度上直接影响着后续的工作能否有效进行,如何准确地检 测出带噪语音的端点至今仍是个难题......”。
3、“.....语言是人类特有的功能,声音是人类常用的信 息交流工具,通过声音传递信息是人类最重要最有效最准确最方便最自 然的信息交换的方式。语音信号处理是门涉及面很广的交叉科学,包含计算机 科学语音学语言学声学生理学心理学和数学等诸多领域的内容。随着 现代科学的蓬勃发展,人类社会越来越显示出信息社会的特点,犹如衣食住 行对于人类是必要的样,通信和信息交换也成为了人类社会存在的必要条件, 不但在人与人之间,而且在人与机器之间每时每刻都需要进行大量的信息交换。 让计算机听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。 语音技术的应用己经成为个具有竞争性的高新技术产业,它正在直接与办 公交通金融公安商业旅游等行业的语音咨询与管理,工业生产部门的 语声控制......”。
4、“.....并且有望成为下代操作系统和 应用程序的用户界面。语音处理内容涉及到计算机科学模式识别信号处理 生理学语音学心理学等学科,还涉及到信号和信息处理系统通信和电子系 统等具体应用领域。语音信号处理与信息科学中最活跃的前沿科学密切联系,并 且共同发展。例如,神经网络理论模糊集理论小波理论是当前热门的研究领 域,这些领域的研究常常把语音处理任务作为个应用实例,而语音处理研究者 也从这些领域的研究进展中找到突破口,使语音处理技术研究取得进展。 经过几十年的努力,语音信号处理在语音识别语音增强语音编码说话 人识别说话人情感识别语音合成等方面取得了巨大的进步,然而,旦这些 技术应用在实际环境中,由于环境噪声信道等方面的影响,性能急剧下降,因 为在实际环境中没有完全纯净的语音信号......”。
5、“.....从输入信号中找到语音部 分的起止点。语音检测是语音识别语音增强以及语音编码等中的个重要环节。 有效的语音检测技术不仅能减少系统的处理时间提高系统的处理实时性,而且 能排除无声段的噪声干扰,从而使后续工作的性能得以较大提高。 第二章语音信号处理 语音信号特点 语音信号是随时间变化的维信号,由连串的音组成,各个音的排列有 定的规则。语音具有声学特征的物理性质,声音质量与它的频率范围有关,语音 信号的频率般是在范围内,随着带宽的增加,信号的自然度将 逐步得到改善。语音信号本身的冗余度是较大的,少数辅音清晰度下降并不明显 影响语句的可懂度,比如通常的模拟电话带宽只有。 语音信号的特性是随时间变化的,所以是种典型的非稳态信号。但是,从 另方面来看,由于语音的形成过程与发音器官的运动密切相关,这种物理运动 比起声音振动速度来讲要缓慢得多,因此......”。
6、“..... 研究表明,在的范围内,语音信号的频谱特性和些物理特征参数基 本保持不变。这样,我们就可以将平稳过程的处理方法和理论引入到语音信号的 短时处理中。因此,短时分析技术贯穿于语音分析的全过程。 语音信号的基本组成单位是音素。音素可分成浊音和清音两大类。如果 将不存在语音而只有背景噪声的情况称为无声。那么音素可以分成无声浊 音清音三类。个音节由元音和辅音构成。元音在音节中占主要部分。所 有元音都是浊音。在汉语普通话中,每个音节都是由辅音元音构成的。在 信号处理中,语音按其激励形式的不同可分为类浊音当气流通过声 门时,如果声带的张力刚好使声带发生张弛振荡式的振荡,产生股准周期的气 流,这气流激励声道就产生了浊音。这种语音信号是种激励信号,它是由规 则的全程激励产生的,其时域波形具有准周期性,语音频率集中在比较低的频率 范围内,短时能量较高......”。
7、“.....因此浊音的过零率低。通常,浊音信号可以由周期激励通过线性滤波器 合成。清音当气流通过声门时,如果声带不振动,而在处收缩,迫使 气流高速通过这收缩部分而产生湍流,就得到清音。清音是由不规则的激励产 生的,发清音时声带不振动,其时域波形不具有周期性,自相关函数没有很强 的自相关周期峰,其语音频率集中在较高的范围内,短时能量较低,因而过零率 较高。通常,清音信号可由白噪声通过线性滤波器合成。 语音信号的短时谱。 短时平均过零率定义为 在矩形窗条件下,可以简化为 短时过零率可以粗略估计语音的频谱特性。由语音的产生模型可知,发浊音 时,声带振动,尽管声道有多个共振峰,但由于声门波引起了频谱的高频衰落, 因此浊音能量集中于以下。而清音由于声带不振动......”。
8、“.....多数能量集中在较高频率上。高频率对应着高过零率,低频 率对应着低过零率,那么过零率与语音的清浊音就存在着对应关系。 音频为电子信息的短时过零率的波形图如下图所示及程序如下 , 绘制短时过零率函数曲线 帧数 短时过零率 短时过零率 图短时平均过零率 分析可知清音的短时能量较低,过零率高,浊音的短时能量较高,过零率 低。清音的过零率为左右,浊音的过零率为左右,两但者分布之间有相 互交叠的区域,所以单纯依赖于平均过零率来准确判断清浊音是不可能的,在实 际应用中往往是采用语音的多个特征参数进行综合判决。 短时过零率的应用 区别清音和浊音。清音的过零率高,浊音的过零率低。此外,清音和浊 音的两种过零分布都与高斯分布曲线比较吻合。 从背景噪声中找出语音信号。语音处理领域中的个基本问题是......”。
9、“.....以确定每个单词语音的信号,亦即找出 每个单词的开始和终止位置。 在孤立词的语音识别中,可利用能量和过零作为有话无话的鉴别。 语音信号端点检测 基于短时能量和短时过零率的双门限端点检测原理 双门限法是利用短时能量和过零率的乘积进行检测的。在基于短时能量和过 零率的双门限端点检测算法中首先为短时能量和过零率分别确定两个门限,个 为较低的门限,对信号的变化比较敏感,另个是较高的门限。当低门限被超过 时,很有可能是由于很小的噪声所引起的,未必是语音的开始,当高门限被超过 并且在接下来的时间段内直超过低门限时,则意味着语音信号的开始。 该算法的原理简述如下 对上述两种特征作个统计估计,得到两个门限值,利用短时能量检测浊音, 短时过零率检测清音,两者配合从而确定语音的端点......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。