帮帮文库

返回

外文翻译__基于网络的自动语音识别能度语言模型(共7页) 外文翻译__基于网络的自动语音识别能度语言模型(共7页)

格式:word 上传:2022-06-25 06:52:32

《外文翻译__基于网络的自动语音识别能度语言模型(共7页)》修改意见稿

1、“.....本文剩余部分内容组织安排如下。第二部分从传统语料库概率模型开始,提供了个逐步能度语言模型描述。第三部分陈述了把能度语言模型整合到个统计学自动语音识别系统中各种各样策略。第四部分描述了实验设置,同时也做了对比实验。最后第五部分进行了总结并且提出了些观点与看法。从语料库可能性到可能性在这部分,我们通过使用新数据源也就是提出了新方法来改进语言建模和个新理论框架,也就是可能性理论。我们首先描述了传统基于语料库概率语言模型,这种语言模型在大多数最先进语音识别系统中得到使用。其次,我们介绍了个新方法来从中估算这些概率。最后,我们提出使用从可能性理论中观念来建造新可以被在上以及传统封闭语料库中估算策略能度策略。基于语料库概率在自动语音识别系统领域,语言模型设计目主要是估算个单词序列先验概率€这个概率可以被分解为条件概率产物......”

2、“.....整体上来讲,元语言模型组成个将会在自动语音识别系统中被使用条件概率集合,为了个单词预测给个部分转录假设。就像在中表现那样,单词概率取决于整个语言历史。实际上,这样长期相关性由于复杂性和语料库限制不能被估算估算如此长单词序列所需要训练数据量是巨大,并且对个元语言模型高阶统计直接估算通常是不可能完成。因此,大多数先进自动语音识别系统只使用或元模型。些可以替代语言评估方法被提出使得长序列单词序列概率估算可行,主要使用提供有效但是间接推理和平滑机制神经网络。然而,理想情况在个详尽语料库中进行直接精确概率估算,在这种情况下,所有可能句子都会被发现。这将表明自动语音识别问题,可以被看做是在个封闭文本文档集合中对正确转录搜索。原文正文,,,,,,,,,€,,,,,音识别系统中方法。能度模型与传统元语言模型在和传统文本语料库估算方面比较和结合......”

3、“.....有大量训练材料可以提供,以及医疗视频转录,这通常是致力于训练外科医生。后者应用环境对应于个只有很少可提供资源非常专业领域。本文剩余部分内容组织安排如下。第二部分从传统语料库概率模型开始,提供了个逐步能度语言模型描述。第三部分陈述了把能度语言模型整合到个统计学自动语音识别系统中各种各样策略。第四部分描述了实验设置,同时也做了对比实验。最后第五部分进行了总结并且提出了些观点与看法。从语料库可能性到可能性在这部分,我们通过使用新数据源也就是提出了新方法来改进语言建模和个新理论框架,也就是可能性理论。我们首先描述了传统基于语料库概率语言模型,这种语言模型在大多数最先进语音识别系统中得到使用。其次,我们介绍了个新方法来从中估算这些中文字外文翻译原文来源译文正文基于网络自动语音识别能度语言模型本文描述了种基于可能性理论新语言模型......”

4、“.....这些模型目在于整合与不可能单词序列有关信息。我们找到了使用这种模型两个主要问题如何估算单词序列长度以及如何把这种模型整合到自动语音识别系统中去。我们提出了个单词序列可能性措施和个基于单词序列统计数据实用估算方法,这种方法尤其适用于来自于数据估算。对于在个经典依靠个语音识别过程中概率模型自动语音识别引擎中使用这些模型,我们提出了些策略和构想。这项工作在两种典型使用场景中进行评估具有非常大训练集广播新闻转录和在个专业领域,对只有非常有限训练数据医疗视频转录。该结果表明,在专业领域任务中,能度模型提供了显著低单词率,但是经典元模型由于训练材料缺少没有能够做到这点。在广播新闻方面,概率模型仍然优于能度模型。但是,这两种模型对数线性组合优于所有单独使用模型,这表明能度模型带来了概率模型所没有信息。简介最先进大词汇量连续语音识别系统是基于元语法模型......”

5、“.....这些模型在很大范围应用中证明了自己效率,但是它们准确度是依赖于庞大相关训练语料库可用性上,但是如果对于资源很少语言或者特定领域,大量数据集就不能保证了。处理这种训练数据缺乏最受欢迎方法之在于在互联网上搜集文本材料和在这些自动搜集数据集上估算元统计模型。这种方法得益于互联网两个有趣特点覆盖范围广和持续更新。覆盖依赖于这样个事实,可能被看作是个趋于无限语料库,大多数语言实现都可以在这里找到。互联网提供了个比通常在训练中用到文本集合大得多语言覆盖。用户通过不断地增加包含新单词和新惯用语言形式文档来提供更新。最后点被广泛地用于统计语言模型各个方面,典型应用如新单词发现,元语法模型适应,不可见元语法模型评价。然而,与互联网内容规模和不稳定性相关技术问题限制了对大范围和统计语言模型更新利用。标准方法会是定期地搜集互联网上可以利用所有数据,在结果语料库上来估算元模型......”

6、“.....等文章上被发表。最后,即使软件和硬件技术不断发展,在整个内容上最新训练仍然是个具有挑战性问题。另个问题是和单词序列在上分布相关。由于文档来源多样性,生产可变性和使用环境等因素,它们可靠性很低。分布不仅仅不可靠,也不会匹配个定向应用程序上下文,这个应用程序上下文决定着可能主题说话风格和语言等级等。考虑到使用整个在实用上和理论上诸多限制,以前很多研究都是提取相关和易于处理子集,这些子集被作为传统估算元统计模型语料库来使用。语料库是通过自动查询搜索引擎取得。就覆盖,语言风格等而言,查询组成技术决定了语料库精确度。不幸是,查询是基于以前知识或者是个与领域相关描述自动提取,这种描述可能是不完整或者不准确。此外,独立于查询组成技术......”

7、“.....这些搜索策略可能完全或者部分是机密。即使这些方法成功地在各种应用程序上下文中得到使用,些作者仍试图通过使用动态元语法估算方法从特殊性中得到更多好处。在和文章中,个刚好及时适应过程被提出了,它是基于个在线文档主题分析和快速更新。在和文章中,作者们提出了个倒转技术,它通过计算包含它文档数量来估算个单词序列概率。这个数量是通过使用个带有定向单词序列查询搜索引擎返回成功地案列数目。这篇文章专注于适应于个专门领域,但是它介绍了使用个搜索引擎进行语言成绩专门估算思想。我们在等里面拓展了这个思想,在这里我们提出了个高效方法,在个自动语音识别别系统中使用搜索引擎命中率作为概率。个特别元统计模型估计提供更新了统计数据,但是没有解决统计数据可靠性问题。为了解决这个问题,我们在等提出了考虑单词序列存在与否而不是它们出现频率语言模型。这些模型是基于可能性理论......”

8、“.....我们通过查询提出了个量化单词序列可能性大小方法,同时将这种能度策略整合到个基于概率模型自动语音识别系统中。在多数情况下,基于概率语言模型都表现不俗,尤其是在高频率和中等频率事件中。低频率事件发生概率估计基本上依赖于个倒转或者平滑策略,这种策略会导致不太可靠概率。已提出能度语言模型仅仅在这些低频率事件上起作用,通过测量这些事件可信度,这种可信度实际上不是由通常估计这些事件概率平滑和倒转技术检测。因此,提出并没有取代基于能度语言模型基于概率语言模型,而是在基于概率语言模型不可靠情况下对其进行补充,这种情况,也就是低频率事件。基于能度语言模型目标估计这些低频事件可信度,目是为了在当主要语言模型地分配给它们个本应有更高概率时候过滤掉它们。这篇文章讲述了个可能性语言模型深入研究......”

9、“.....能度模型与传统元语言模型在和传统文本语料库估算方面比较和结合。我们围绕两个任务做了实验广播新闻转录,有大量训练材料可以提供,以及医疗视频转录,这通常是致力于训练外科医生。后者应用环境对应于个只有很少可提供资源非常专业领域。本文剩余部分内容组织安排如下。第二部分从传统语料库概率模型开始,提供了个逐步能度语言模型描述。第三部分陈述了把能度语言模型整合到个统计学自动语音识别系统中各种各样策略。第四部分描述了实验设置,同时也做了对比实验。最后第五部分进行了总结并且提出了些观点与看法。从语料库可能性到可能性在这部分,我们通过使用新数据源也就是提出了新方法来改进语言建模和个新理论框架,也就是可能性理论。我们首先描述了传统基于语料库概率语言模型,这种语言模型在大多数最先进语音识别系统中得到使用。其次,我们介绍了个新方法来从中估算这些概率。最后......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
外文翻译--基于网络的自动语音识别能度语言模型.doc预览图(1)
1 页 / 共 7
外文翻译--基于网络的自动语音识别能度语言模型.doc预览图(2)
2 页 / 共 7
外文翻译--基于网络的自动语音识别能度语言模型.doc预览图(3)
3 页 / 共 7
外文翻译--基于网络的自动语音识别能度语言模型.doc预览图(4)
4 页 / 共 7
外文翻译--基于网络的自动语音识别能度语言模型.doc预览图(5)
5 页 / 共 7
外文翻译--基于网络的自动语音识别能度语言模型.doc预览图(6)
6 页 / 共 7
外文翻译--基于网络的自动语音识别能度语言模型.doc预览图(7)
7 页 / 共 7
预览结束,喜欢就下载吧!
  • 内容预览结束,喜欢就下载吧!
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档