帮帮文库

返回

基于SVM藏文文本分类的研究与实现(论文原稿) 基于SVM藏文文本分类的研究与实现(论文原稿)

格式:word 上传:2022-08-17 04:20:00

《基于SVM藏文文本分类的研究与实现(论文原稿)》修改意见稿

1、“.....获得核函数参数如下模型测试模型下不同核函数实验对比模型测试是对模型训练学习性能的种检测,模型从训练数据集中获取到参数后,在其它参数相同的条件下,分别对惩罚系数取不同的值,并在表测试样本集构成基于藏文文本分类的研究与实现论文原稿把所有文本进行向量空间模型化,形成样本数据集,本次实验由部分内容组成,分别是分类模型对训练集样本数据进行训练获取模型参数对测试样本数据进行分类预测对实验结果进行评价......”

2、“.....使待提取特征集中的特征形成特征簇,并加权平均特征簇内特征,最终得到文本类别分类特征项。特征项定义特征项是文本的属性包含着文本的信息,在藏文文本中字是其属性的个元素,字与字之间主要由音节点来数的参数并进行常用核函数分类性能对比,最后与回归分类器进行同等条件下的实验对比,验证了支持向量机模型在藏文文本分类中具有良好的分类效果。特征项权重设置与选择特征项的权重设置方法很多,通常以该特征项在样本中出现的频度作为其特征目前,机器学习算法已成为主流的方法,尤其在中文文本分类算法的研究上已经相当成熟......”

3、“.....在武汉理工大学熊浩勇的硕士毕业论文中已经详细描述,虽然其具有对模型参数的设置相当复杂并且耗费时间长等息的收集而成共篇,主要以剔除文本数据较小的文本并适当组合形成新语料的方式进行预处理,语料数据数据如表。关键词藏文文本分类支持向量机回归引言由于文本记录着时代变迁的痕迹,文本的数量在历史的长河中不断增加,因人们在查阅和学习的过包括文本向量空间模型化,获取中核函数的参数并进行常用核函数分类性能对比,最后与回归分类器进行同等条件下的实验对比......”

4、“.....关键词藏文文本分类支持向量机回归特征簇内特征,最终得到文本类别分类特征项。目前,机器学习算法已成为主流的方法,尤其在中文文本分类算法的研究上已经相当成熟,特别是算法利用最小结构风险的原理使得分类性能更加优异,在武汉理工大学熊浩勇的硕士毕业论文中已经详细描述,虽然其具含的藏字作为特征项,并且假设每个音节点之间的藏字相互独立。特征项权重设置与选择特征项的权重设置方法很多,通常以该特征项在样本中出现的频度作为其特征权重,首先统计出上述类别文本中各个字出现频率,使藏字特征数据化成向量......”

5、“.....所以文本分类的有效性对上述问题的解决具有重要作用。同时伴随着科学技术的发展,人们开始利用计算机的高效性进行文本自动分类,因此对分类数学模型的选择变得更为重要。基于藏文文本分类的研究与实现论文原稿。,因此对分类数学模型的选择变得更为重要。基于藏文文本分类的研究与实现论文原稿。分类器构建算法确定目标函数文本语料的收集和预处理本次基于模型的藏文文本分类实现的语料来源于对中国西藏新闻网,人民网,西藏日报等网站相关文章信明,廖周宇基于算法的文本分类技术研究计算机仿真,高定国,珠杰......”

6、“.....杨玉珍,刘培玉,朱振方,邱烨,应用特征项分布信息的信息增益改进方法研究山东大学学报,杨杰明文本分类中文本表示模型和特征言由于文本记录着时代变迁的痕迹,文本的数量在历史的长河中不断增加,因人们在查阅和学习的过程中对相关文本的寻找显得十分麻烦,所以文本分类的有效性对上述问题的解决具有重要作用。同时伴随着科学技术的发展,人们开始利用计算机的高效性进行文本自动分类有对模型参数的设置相当复杂并且耗费时间长等不足之处,但所获取的模型参数十分精确。由于的核函数很多......”

7、“.....藏文文本也存在这种情况。因此实验目的在于测试该方法是否在藏文文本分类中具有良好的性能。主要过程可以选择相对高频字与相对低频字作为待选特征集,并利用信息增益算法对待选特征集降维,从待选特征集中选择部分信息增益相对大的特征项作为待提取特征集。最后利用欧氏距离算法对待提取特征集中的特征进行聚类,使待提取特征集中的特征形成特征簇,并加权平均选择算法研究吉林大学,。特征项定义特征项是文本的属性包含着文本的信息,在藏文文本中字是其属性的个元素,字与字之间主要由音节点来分离,字可分为个字符多个字符......”

8、“.....为了统计的方便和对模型的测试,本次试验选择个音节点里包基于藏文文本分类的研究与实现论文原稿零。实验验证了模型对藏文文本具有良好的效果,因此后期会继续研究藏文文本结构形式,增大特征信息量,提高分类的效果。参考文献熊浩勇,基于的中文文本分类算法研究与实现武汉理工大学,李航,统计学习方法北京清华大学出版社,崔建明,刘建设定不同的惩罚参数对分类效果具有定影响,和变化趋势相似。由选择的特征向量中的值比较大,使特征向量内积和差值相对很大,因此和的分类效果不好。从表测试结果可以看出,当核函数选择为和测试样本数据集下进行测试......”

9、“.....与回归模型测试结果对比回归模型在以前的文本分类实验中,分类效果较好,因此本次实验选择回归模型与模型对藏文文本分类性能进行对比,其径,训练样本数据越多,对模型参数的获取就越精确,对训练样本数据的训练有效性对后续测试结果有着直接的影响,训练样本集如表。获取核函数参数实验中,把线性函数多项式函数函数和函数作为模型的核函数,通过对训练样本集构成的训练样本离,字可分为个字符多个字符,多个音节点之间又有定的关联,为了统计的方便和对模型的测试,本次试验选择个音节点里包含的藏字作为特征项......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
基于SVM藏文文本分类的研究与实现(论文原稿).doc预览图(1)
1 页 / 共 7
基于SVM藏文文本分类的研究与实现(论文原稿).doc预览图(2)
2 页 / 共 7
基于SVM藏文文本分类的研究与实现(论文原稿).doc预览图(3)
3 页 / 共 7
基于SVM藏文文本分类的研究与实现(论文原稿).doc预览图(4)
4 页 / 共 7
基于SVM藏文文本分类的研究与实现(论文原稿).doc预览图(5)
5 页 / 共 7
基于SVM藏文文本分类的研究与实现(论文原稿).doc预览图(6)
6 页 / 共 7
基于SVM藏文文本分类的研究与实现(论文原稿).doc预览图(7)
7 页 / 共 7
预览结束,喜欢就下载吧!
  • 内容预览结束,喜欢就下载吧!
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档