帮帮文库

返回

面向健康问答社区的语义检索技术研究与分析(论文原稿) 面向健康问答社区的语义检索技术研究与分析(论文原稿)

格式:word 上传:2022-08-17 04:05:40

《面向健康问答社区的语义检索技术研究与分析(论文原稿)》修改意见稿

1、“.....虽然痤疮没有被收录进语义词典,但是通过训练出的词向量,很容易找出和这些专业词上下文相关的其它词,这就大大提升检索结果。此外,还可以注意到基于语义词典的效果提升不是很明显,甚至没有经典算法好。我们从公式出发,深入分析其子项,其结果如表所示。发现基于的词语相似度计算方式在本文的应用背景下存在不合理性,这主要有以下两个原因文献提出的词义相似度计算方式是以的概念和义原为基础,个含女性关键词的妇科疾病相关文档也会得出很高的分数,这是不合理的。如果使用词向量来衡量语义关系,那么在词向量的训练过程中,词向量捕获了上下文关系,其承载的数据不仅可以绑定女性和妇科疾病的关系,而且很好地解决了因词典收录不足带来的语义空白问题。面向健康问答社区的语义检索技术研究与分析论文原稿。分析由上述实验结果可知......”

2、“.....其中,在数据集上提升了,这主要受数据集大和。是业界广泛使用的英文文本分类数据集,它有两种划分和。本文采用的是划分,训练集共篇文档,测试集篇文档,按主题信息对其进行分类,主题词总共个,测试集中主题词共个,实验是对测试集中的主题词进行检索。和作为中英文领域的语义词典,需要人工不断完善和补充,在面向处理专业性很强的文本时,会因大量专业词汇没有被收录进词典主题模型是种潜在语义分析技术,利用统计学方法,可以识别出大规模文档集中的主题信息。主题模型会训练得到两个模型文档主题模型和主题词模型,吕亚伟等人就以此提出了利用主题信息作为特征的词语相似度计算方法。但是,主题模型在面对文本的动态增长时,找到合适的主题投射纬数也愈显困难。是由谷歌公司以等人的工作为基础推出的词向量训练工具。对于给定的语料库......”

3、“.....是对事物原样及其自身的描述,而后被借鉴到计算机领域。根据前人的研究将本体拆解成了层含义概念模型明确形式化和共享。借此,诸多以本体技术为基础的检索技术出现。然而本体知识库的建立需要多位领域专家的参与,面对海量的健康问答社区数据源构建套知识库无疑是件相当巨大的工程。同义词词典为每个被收录的词维护了相关的语义信息,代表有和。语义词词典对检索时关键词的拓展关键词的拓展起到了重要的作用,同时刘群等人提出了以为基础的词语相似度计算方法,为中文词义相似度的计算填补了空白。但同义词词典存在个巨大的缺陷收录的词有限。对于不存在于词典中的词,无法衡量它们的相似度,如上述问句中的瘦身,因为没有被收录,所以就无法衡量瘦身和减肥之间的语义关系,从而两个语义上相似的问句也因核心词的不相似而变得不相关。面向健康问答社区的语义检索技术研究与分析论文原稿......”

4、“.....是由谷歌公司以等人的工作为基础推出的词向量训练工具。对于给定的语料库,可以通过神经网络模型将文本中的词映射到定维度的向量上,训练出的词向量由于捕获了文本的上下文信息不仅能够很好地反映词义信息,而且解决了词多义的问题。所以,基于以分析本文将词向量作为衡量语义的主要手段并展开工作。相关工作目前,语义检索领域的研究主要集中在本体技术语义词典和仅可以绑定女性和妇科疾病的关系,而且很好地解决了因词典收录不足带来的语义空白问题。所以基于以上分析,本文提出使用训练出的词向量作为公式衡量词义相似度的方法用表示词的词向量,是词向量的维度大小,那么两个词之间的语义距离可以通过余弦相似度计算得到实验结果及分析实验结果本节实验数据来自于和。是业界广泛使用的英文文本分类数据集,它有两种划分面向健康问答社区的语义检索技术研究与分析论文原稿到了重要的作用......”

5、“.....为中文词义相似度的计算填补了空白。但同义词词典存在个巨大的缺陷收录的词有限。对于不存在于词典中的词,无法衡量它们的相似度,如上述问句中的瘦身,因为没有被收录,所以就无法衡量瘦身和减肥之间的语义关系,从而两个语义上相似的问句也因核心词的不相似而变得不相关。面向健康问答社区的语义检索技术研究与分析论文原稿。长度,则这个路径中所有节点的分类概率连乘积即为语言模型需要求解的映射层对所有的输入向量进行了合并,所以把向量的梯度变化贡献到了每个向量分量上。所以从上述分析,可以看出在训练语言模型的过程中,是捕获词了语义信息的通过周围单词预测目标词的训练方式很好地反应了目标词的语义环境,并且以数学向量的形式承载这种语义信息。相关工作目前......”

6、“.....作者单位同济大学电子与信息工程学院计算机科学与技术系上海市。和作为中英文领域的语义词典,需要人工不断完善和补充,在面向处理专业性很强的文本时,会因大量专业词汇没有被收录进词典而无法计算相似度,比如健康领域中的和阿尔茨海默病和痴呆此外,词多义的问题也无法得到很好的解决,比如说男性和女性在按照论文实的输出层采用了上述的树形结构,表示和词前后紧邻的相关词,表示相关词的词向量,是词的树编码值,如果向量預测到词,则需要经过个分支,每次分支都是次分类。中编码被定义成负类,编码定义成正类,根据逻辑回归,个节点被分到正类中的概率是算法对词典中的每个词,算法输出层必然存在条导向这个词的分类路径,用表示整个路题模型上本体概念源自于哲学中的本体论,是对事物原样及其自身的描述,而后被借鉴到计算机领域。根据前人的研究将本体拆解成了层含义概念模型明确形式化和共享。借此......”

7、“.....然而本体知识库的建立需要多位领域专家的参与,面对海量的健康问答社区数据源构建套知识库无疑是件相当巨大的工程。同义词词典为每个被收录的词维护了相关的语义信息,代表有和。语义词词典对检索时和。本文采用的是划分,训练集共篇文档,测试集篇文档,按主题信息对其进行分类,主题词总共个,测试集中主题词共个,实验是对测试集中的主题词进行检索。主题模型是种潜在语义分析技术,利用统计学方法,可以识别出大规模文档集中的主题信息。主题模型会训练得到两个模型文档主题模型和主题词模型,吕亚伟等人就以此提出了利用主题信息作为特征的词语相似度计算方法。但是,主题模型在面对文本的动态增长时的计算方式中有的相似程度,而和在的开源实现中也有的相似程度。从物种的角度来说它们确实是高度相似的,但是从性别的角度来说它们完全代表不同的人种......”

8、“.....女性有妇科病,但按照上述计算模型,男性和包含女性关键词的妇科疾病相关文档也会得出很高的分数,这是不合理的。如果使用词向量来衡量语义关系,那么在词向量的训练过程中,词向量捕获了上下文关系,其承载的数据面向健康问答社区的语义检索技术研究与分析论文原稿,黃承慧,印鉴,陆动化技术与应用,付苓,崔新春,乔鸿基于本体的语义检索研究情报科学,陈泳,林世平基于本体的语义检索技术全国智能信息网络学术会议董振东,董强知网和汉语研究当代语言学,刘群,李素建基于知网的词汇语义相似度计算中文计算语言学,吕亚伟,李芳,戴龙龙基于的中文词语相似度计算北京化工大学学报自然科算法的可行性就行了验证,并对实验结果进行了详细分析,特别是在使用语义词典来计算词义相似度时所带来的问题。为进步提高实验结果,下步将重点放在词向量的训练上......”

9、“.....同时对检索的时间进行优化。参考文献可以由多个概念表征,即词多义,而且最大的概念相似度值会作为词语相似度值返回。概念相似度计算依赖义原,所以义原的相似度值作为主要部分制约着整个词语的相似度值。以词全身和胸腔为例,概念中都有基本义原部件,按照上述方式在其它义原关系义原和关系符号为空的情况计算得到的相似度值为,这是不合理的。虽然对全身和胸腔标注了部件这基本义原,但缺乏更细致的其它义原,即缺乏更细致的语义划分,导致了在本文应用背景下效果较差影响,训练出的词向量表述能力有限。另外从实验结果中得知,在这个关键词上准确率只有,而本文的方法的准确率则高达,而且这个词并没有收录,说明词向量确实对算法起到了定优化作用。在数据集上,本文的算法提升效果明显,主要有以下两个原因用于训练词向量的语料库丰富,训练出的词向量表述能力强。健康问答领域的数据集专业性强,领域明显......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
面向健康问答社区的语义检索技术研究与分析(论文原稿).doc预览图(1)
1 页 / 共 11
面向健康问答社区的语义检索技术研究与分析(论文原稿).doc预览图(2)
2 页 / 共 11
面向健康问答社区的语义检索技术研究与分析(论文原稿).doc预览图(3)
3 页 / 共 11
面向健康问答社区的语义检索技术研究与分析(论文原稿).doc预览图(4)
4 页 / 共 11
面向健康问答社区的语义检索技术研究与分析(论文原稿).doc预览图(5)
5 页 / 共 11
面向健康问答社区的语义检索技术研究与分析(论文原稿).doc预览图(6)
6 页 / 共 11
面向健康问答社区的语义检索技术研究与分析(论文原稿).doc预览图(7)
7 页 / 共 11
面向健康问答社区的语义检索技术研究与分析(论文原稿).doc预览图(8)
8 页 / 共 11
面向健康问答社区的语义检索技术研究与分析(论文原稿).doc预览图(9)
9 页 / 共 11
面向健康问答社区的语义检索技术研究与分析(论文原稿).doc预览图(10)
10 页 / 共 11
面向健康问答社区的语义检索技术研究与分析(论文原稿).doc预览图(11)
11 页 / 共 11
预览结束,喜欢就下载吧!
  • 内容预览结束,喜欢就下载吧!
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档