1、“.....提取特定话者的语音。语音分离问题来源于著名的鸡尾酒会问题,这个问题可以被描述成在复杂的背景噪声和多个人交谈的情况下,能够集中注意力于个人说话内容的能力盲信号分离技术是目前的主要研究方向。语音分离技术的研究具有重要的意义在语音识别系统的前端进行语音分离,可以极大的提高识别系统在实际环境中的分辨能力在电话会议系统中,由于麦克风记录的是混合语音是感兴趣说话人的语音质量大大降低,语音分离技术可以用来提高所感兴趣的人的语音质量,从而改善电话会议的效果另外语音分离算法可以实现声源定位,确定说话人的个数,这方面的研究对智能机器人的智能化研究具有十分重要的作用,。语音分离技术的的发展和现状语音增强的经典算法是谱减法,它在检测到目标语音处于不活动状态的情况下,估计背景噪声的统计特性,然后利用这些统计特性实现语音信号的增强。它适合平稳噪声,不适合语音分离,因为干扰语音源是非平稳噪声......”。
2、“.....所以无法进行语音分离。子空间分解法是依据字空间准则,把含噪语音进行分解,信号分解为信号字空间和噪声字空间,得到信号和噪声不同的统计特性,然后去掉噪声,它也只适用于去除平稳噪声,因为目标语音和干扰语音没有显著的统计特性和谱特性差别,所以该方法同样不能进行有效的语音分离。最小均方算法是利用许多与干涉源信号相关的参考信号,来除去有用语音信号中的干扰项,但在实际的语音分离中,会将部分目标语音去除,导致语音分离的效果变差。基于多麦克风阵列的波束形成技术已经被用来抑制混合语音中的干涉语音。将从多个麦克风阵列中得到的语音通过各种各样的滤波过程,实现对特定语音的基于的语音分离技术研究抑制或放大,滤波过程依赖于对声学环境的先验知识或利用统计特性的自适应的进行。但它有自身的局限性第,为增强个语音需要许多麦克风,代价高第二......”。
3、“.....使用上不方便第三,波束形成是频率相关技术,由于语音是全频带信号,很难在各个频段都取得较好的效果。由以上看出由于构成混叠语音的各源语音信号在时域和频域上完全重叠,因而常用的语音增强方法难以将感兴趣的目标语音从干扰语音中分离出来。目前,这方面的最新研究主要以盲信号分离和声场景分析,两类方法为主。盲信号分离技术所谓盲信号分离就是根据观测到混合数据向量确定变换以恢复原始信号或信源。盲信号分离中的盲指的是源信号的形式是未知的,源信号的混合方式是未知的。盲信号处理主要应用到阵列信号处理无线通信中用个通道实现多用户通信服务通信均衡脑电信号分离多说话人语音信号的分离以及隐性经济因素提取等用途。已经成为目前研究的个热门。盲信号处理需要几个假设条件源信号的个数和观测信号的个数相等源信号的各分量都是零均值的实随机变量......”。
4、“.....它最早是用来解决鸡尾酒会问题的。它最早由和提出。下面我们看下什么是鸡尾酒会问题。假设在个房间内有两个人同时说话,在不同的位置放两个话筒记录房间的基于的语音分离技术研究说话声,现在要将两个人的说话声分离出来。假设话筒采集信号为两个人的说话语音信号用,表示,由于每个话筒记录的均是两人的混合声音,所以可用如下方程表示其中系数是与话筒和说话人距离相关的参数。在这种情况下我们希望只利用观测信号和,就能得到源信号和,这就是鸡尾酒会问题。如果值是已知的,利用传统的方法很容易解决,反之,问题就比较复杂。然而,实际上只要,是统计的,我们可用统计方法估计出的值。正是这样种统计方法。它能从传感器观测到的混合信号中分离出源信号,是分离出的信号之间尽可能......”。
5、“.....通过实现的盲源分离引起了广泛的关注,主要是因为该方法在语音识别特征提取生物信号处理以及通信系统和金融数据分析等方面有着广泛的应用。特征提取是广泛运用在图象和声音压缩技术,通过方法可源信号„传感器„„图典型的多源多传感器框图在定条件下,能有效的从多通道观测信号中分离出源信号。其主要任务是估计分离矩阵,以实现从多通道观测信号中分离出相互的信源分量,即,希望能较好的逼近真实源信号。算法本节主要介绍种结构简单的定点快速算法,该方法基于定点递推算法,对目标函数的优化速度快,对任何数据都适用,具有很好的稳定性,是目前使用非常广泛的种方法。其结构图如下基于的语音分离技术研究图算法框图由公式的推导过程中,我们知道其中是个正常数,是均值为,方差为的高斯随机变量。的均值为,方差为。函数是个非二次函数......”。
6、“.....所以只要调节使分离信号的负熵和最大,就等于分离出的信号之间的互信息最小。目标函数的选取在节中,我们提到方法目标函数优化算法。那么在实际计算中所选择的目标函数必须满足计算简单的要求,而且方法的统计特性如致性鲁棒性取决于目标函数,目前对目标函数的选取有以下。这里,,。是个较好的通用函数。在上节中式中,判据基于的语音分离技术研究我们就选用的该函数作为目标函数的。当分量是超高斯性很强的信号且对鲁棒性能要求很高时,我们更经常选。当计算量必须减少时,和就应该用分段多项式函数代替。只适合亚高斯信号,且抽样值没有干扰的情况。优化算法优化算法的选择对算法特性收敛速度,内存要求起决定作用。具体途径分为两条,即批处理和自适应处理。批处理的计算量比较大,而自适应处理虽然计算简单,但收敛速度慢,需要选择好迭代步长。尽管这样......”。
7、“.....批处理的固定点的快速算法不使用随机梯度搜索法而采用定点迭代法,每次迭代中采样的数据是成批使用,该方法是并行分布式,优化速度快,对任何数据都适用,具有很好的稳定性。方法主要分两步实现对观测信号的预处理,分量提取。下面我就分别介绍。信号的预处理在应用之前要对数据做预处理使估计更加简单稳定,更加符合前面的约束条件,信号的预处理主要包括中心化和白化。中心化中心化就是去均值,通过对信号减去其均值,使信号的均值为,这样做只是为了简化的估计算法,设信号,其均值为,则中心化过程为,这是信号的均值为白化信号通过个白化滤波器,得到白化后的信号,也就是对信号进行线性变换,使的元素是不相关的,而且具有单位方差,的协方差矩阵是个单位阵。通常白化处理采用特征值分解的方法。假定,其中为的特征向量阵,为特征值对角阵......”。
8、“.....变成新的,是个正交阵,则有下式成立因为是个正交阵,所以只需估计个参数,而不是个参数,这就减少半的工作量。分量的提取在上节中我们得到被处理过的信号,本节对它进步处理,即寻找分离矩阵以实现分量的提取注此处的是针对处理以后的信号而言的分离过程是个迭代逼近过程,我们用变量表示迭代步数,令ˆ是ˆ中的分量,为分离矩阵中与ˆ对应的行向量,即ˆ分离过程中,用式所定义的目标函数对分离结果ˆ的非高斯性进行度量,并对进行调整,算法的调整公式为当两次的无变化或变化很小时,即可认为ˆ,迭代过程结束。由公式中的均值计算可通过时间的平均获得。所以每次迭代后,都要对进行归化处理,以确保分离结果具有单位能量。以上是对单个分量的迭代过程。同理......”。
9、“.....。但每次提取个分量后,从观测信号中减去这个分量,如此重复,直到分量完全分离出来。并可得到混合矩阵和分离矩阵。算法的特点⒈在模型中,收敛速度是二次以上的,而梯度搜索法只是次收敛。⒉与梯度搜索法相比,的步长参数容易确定。基于的语音分离技术研究⒊该算法适用任何非高斯信号。⒋可以通过选择不同的使算法获得不同的性能。⒌可逐个估计分量。⒍该算法是并行的分布的,计算简单,需要内存少。仿真实验我们采用段音乐信号,段人声信号作为源信号,信号的采样频率是赫兹长度为点,使用混合矩阵对源信号进行线性混合得到两个观测信号,。使用上述算法对观测信号进行分离,丛中得出两个源信号的近似值结果如下图所示图音乐信号与语音信号分离结果图我们采用段甲人的说话声,段乙人的说话声作为源信号,信号基于的语音分离技术研究的采样频率是赫兹长度为点,使用混合矩阵对源信号进行线性混合得到两个观测信号......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。