基于词向量的藏文情感词典的构建方法研究（论文原稿）

格式：word 上传：2022-08-17 03:18:40

《基于词向量的藏文情感词典的构建方法研究（论文原稿）》修改意见稿

1、“.....今后将进步完善基准词典的质量，扩大训练语料的范围和类别，从而增加词向量的规模和质量，以便获得更实用的藏文情感词典。参考文献梅莉莉，黄河燕等情感词典基于词向量的藏文情感词典的构建方法研究论文原稿析本文对基于词向量扩充情感词典的几种方法进行验证，并选取最优的扩充法，并使用该方法从语料中自动扩充藏文情感词，实验结果如表所示。该方法与方法和权重递增法的结果对比如图所示。实验结果表明，本文提出的方法综合效果最佳，有效避免了方法对非情感词识别效果差的问题，同时解决了权重递增首先对训练语料进行去噪分词。藏文字符编码范围为，其中包括了十个藏文特殊符号。然后用作为分词标记，对文本进行分词......”。

2、“.....查询基准词典，如果当前词语不在基准情感词典中，则可以作为目标词。从语料中得到的目标词在实际扩充的时候才使用。在实验阶段要计算准确率召回率等指标以衡量种方主要包括两个方面，即基础情感词和辅助词表，具体内容如表所示。基于词向量扩充藏文情感词典近年来，随着深度学习的发展，词向量被广泛应用自然语言处理领域中。采用神经网络训练出来的词语向量，能够方便快速的挖掘词与词之间的语义关系，词语的相似度越高，其向量距离越近，情感词典的扩充正是基于这理论。构建藏文基准情感词典本文参照大连理工大学信息检索研究室构建的中文情感词汇本体库的相关标准来构建藏文情感词典......”。

3、“.....同时借助中文情感词典，并结合藏文本身的特征构建了藏文情感计算的词汇构建标准。其中，情感分为大类小类情感强度分为等档，表示强度最情感词经过相似度计算，理论上应该找不到与其相似的种子词，从而不对其进行情感标注。构建藏文情感词典的方法藏文情感词典的构建是藏文文本情感分析和文本挖掘领域中重要的基础性工作，且情感词典的质量在很大程度上影响了文本情感分析的结果。随着网络词语的流行和使用，完全依靠人工完善和扩充情感词典的方法是不建方法研究论文原稿。方法算法的基本思想是在距离空间里，如果个样本的最接近的个邻居中，绝大多数属于个类别，则该样本也属于这个类别。俗称为随大流。针对情感新词的识别......”。

4、“.....保证找到的邻居确实为近邻，如果个词语与所有种子词的相似度都低于阈值，则认为该词不属于情络训练出来的词语向量，能够方便快速的挖掘词与词之间的语义关系，词语的相似度越高，其向量距离越近，情感词典的扩充正是基于这理论。构建藏文情感词典的方法藏文情感词典的构建是藏文文本情感分析和文本挖掘领域中重要的基础性工作，且情感词典的质量在很大程度上影响了文本情感分析的结果。随着网络词语的流行和述情感词，同时借助中文情感词典，并结合藏文本身的特征构建了藏文情感计算的词汇构建标准。其中，情感分为大类小类情感强度分为等档，表示强度最大，为强度最小情感极性分为种，为中性词，为褒义词为贬义词......”。

5、“.....否定词和双重否定词在基于规则的藏文情感分析中基于词向量的藏文情感词典的构建方法研究论文原稿行的。为了建立部较完整实用准确的藏文情感词典，需要分两部分来完成构建藏文基准情感词典和动态扩充藏文情感词典。首先人工收集和整理了部藏文基准情感词典，在此基础上，基于词向量扩充情感词典，最终能建立部比较实用的藏文情感词典。基于词向量的藏文情感词典的构建方法研究论文原稿。库作为新的种子词继续进行扩充。模型框架如图所示。该方法不同于传统的相似度扩充法，方法次只能确定个词语的情感，虽然降低了效率，但可以有效避免传统方法的迭代误差，提高情感标注的准确率。另方面......”。

6、“.....特别是非情感词，因为有了距离阈值的限制，模型具有较好的实际应用效果，实验中除了要衡量几种方法对情感词的识别效果，还要衡量方法对非情感词的識别效果。因此，目标词库中还包括了个非情感词。方法在藏文情感词典扩充上的应用本文主要通过计算词语间的余弦距离来实现藏文情感词的扩充，其计算公式如所示。如以上公式所示，是目标词的向量表示，词。该理论用于情感词典扩充中，首先对目标词库中的每个目标词，计算其与种子词库中所有种子词的相似度，选取与该目标词相似度大于阈值的前个词语存入中然后通过匹配情感词典找出这个词语中出现次数最多的情感类别，将该目标词标注为这个类别最后将放入种子用......”。

7、“.....为了建立部较完整实用准确的藏文情感词典，需要分两部分来完成构建藏文基准情感词典和动态扩充藏文情感词典。首先人工收集和整理了部藏文基准情感词典，在此基础上，基于词向量扩充情感词典，最终能建立部比较实用的藏文情感词典。基于词向量的藏文情感词典的着至关重要的地位。若是只考虑情感词而不考虑否定词计算，情感倾向与实际的情感倾向不致，甚至结果完全相反。因此，本文构建的藏文基准情感词典主要包括两个方面，即基础情感词和辅助词表，具体内容如表所示。基于词向量扩充藏文情感词典近年来，随着深度学习的发展，词向量被广泛应用自然语言处理领域中。采用神经子词的向量表示，主要计算和的值，如果值越大......”。

8、“.....发现阈值大于时效果最佳。实验的步骤如图所示。构建藏文基准情感词典本文参照大连理工大学信息检索研究室构建的中文情感词汇本体库的相关标准来构建藏文情感词典，利用词语词性种类情感类别情感强度及极性等信息来基于词向量的藏文情感词典的构建方法研究论文原稿用作为分词标记，对文本进行分词。然后针对分词结果，查询基准词典，如果当前词语不在基准情感词典中，则可以作为目标词。从语料中得到的目标词在实际扩充的时候才使用。在实验阶段要计算准确率召回率等指标以衡量种方法的效果，因此选择了个已知情感倾向的词语作为目标词，其中褒义词个，贬义词个，中性词个。为了杨小平，张中夏，王良......”。

9、“.....王科，夏睿情感词典自动构建方法综述自动化学报，杨奎，建综述中文信息学报，不能支持情感多分类的问题。方法扩充得到的藏文情感词典基于以上的探讨和实验分析，本文选择方法在万多个藏文文本上进行扩充藏文情感词。共得到了个正向情感词，个负向情感词，个中性情感词。部分结果的截图如图所示。总结本文在分析国内外情感词典扩充方法的基础上，结合藏文本身的特点，提出了基于词的效果，因此选择了个已知情感倾向的词语作为目标词，其中褒义词个，贬义词个，中性词个。为了使模型具有较好的实际应用效果，实验中除了要衡量几种方法对情感词的识别效果，还要衡量方法对非情感词的識别效果。因此，目标词库中还包括了个非情感词......”。

温馨提示：手指轻点页面，可唤醒全屏阅读模式，左右滑动可以翻页。