帮帮文库

返回

基于RF的排序学习方法在电影数据集中的应用(电影论文) 基于RF的排序学习方法在电影数据集中的应用(电影论文)

格式:word 上传:2023-05-06 15:05:00

《基于RF的排序学习方法在电影数据集中的应用(电影论文)》修改意见稿

1、“.....针对电影检索的排序学习模型框架基于排序学习的电影检索系统大致分为两个阶段学习阶段和排序阶段,整体框架如图所示。基于的排序学习方法在电影数据集中的应用电影论文。电影自建数据集本文使用的所有数据来源于网站和,两者都是亚马逊旗下的电影数据统计网站。除文是业界广泛使用的个排序学习算法,它很好地契合了排序学习的思想,即重新定义了个梯度,表示下次迭代文档在排序列表将要排序的方向和强度。将梯度和结合就是。是在的基础上对算法进行的改进。最大的特点是对代价函数做阶泰勒展开,同时引入阶基于的排序学习方法在电影数据集中的应用电影论文的精确度基本处于以上,对排名预测有比较良好且稳定的效果。综上所述,本文以提高电影排序模型的性能为出发点,自建电影数据集,并提出种基于的自适应双集成排序学习方法......”

2、“.....新增加了个特征设计了个能自动确定子采样比例的函数将的基排序器从树模型即回归树替换为集成模型。针对电影检索的排序数据归化数据格式化,最终得到包含个特征的条排序学习格式即查询电影对格式的电影数据集。数据集的查询号代表电影上映年份和周数比如表示年第个周末上映的电影。自建电影数据集的标签划分方式为,将部电影下周末排名作为当前周该电影数据的标注,排名处于前位的电影属于相关性电影即标签等级为排名在第位之后的电影为非相关性电影即标签等级为。基于的自适应公式和双集成排序学习思想原因是,由于是小规模数据集,在训练量不够大的情况下梯度会出现较多位臵移动上的判断,从而导致模型的精度有所下降。至于与普通方法相比,种双集成模型在评估指标上都至少高出个百分点......”

3、“.....这证实了本文提出的方法的有效性。为进步验证本文提出的自适应函数的有效性,将以为例做实验是组查询中平均精度值的平均值。而查询的是相关电影在排名列表每个位臵上精确度的平均值,其定义如下实验结果以下和均是在次独立实验下得出的平均值。表展示了以为基排序器和分别在,和测试集上的实验结果。采用业界基准作为子采样比例。从评价指标来看,在个数据集上的表现年提出了基于的型排序学习方法,该方法将评价指标如最大化作为损失函数的优化目标。实验与分析实验设臵实验环境为系统,内存。为了增加实验的对比性及验证提出方法的有效性,本文对自建电影数据集进行随机抽取,将其划分为,和个数据集进行实验。其中,训练集和测试集按的比例进行划分,具体信息见表。参数设臵方面,集成次数设臵为,基排序器集,归化折扣累计增益和......”

4、“.....发现输出的双集成模型比单集成模型在两项指标上均有左右的提升。关键词子采样双集成模型排序学习电影数据集随机森林随着大数据时代的来临,如何对互联网上的信息进行有效排序,使排序学习成为信息检索领域的个热门研究方向,。在用户查询信息的时候,信息检索系统的任务是返回个,其中是可能的最高。基于本文的标签划分方式,即以排序列表中的名次为相关与非相关的界限,后面实验将采用来评估。基于的排序学习方法在电影数据集中的应用电影论文。摘要针对自制电影数据集中电影的排序问题,文章提出了种基于的自适应双集成排序学习方法。先利用电影媒体网站数据构建个特征自建基于排序学习格式的电影数据集,至于与普通方法相比,种双集成模型在评估指标上都至少高出个百分点,在评估指标上至少高出个百分点。这证实了本文提出的方法的有效性......”

5、“.....将以为例做实验。实验与分析实验设臵实验环境为系统,内存。为了增加实验的对比性及验证提出方法的有效性,本文对自建电影基于的排序学习方法在电影数据集中的应用电影论文次数设臵为,学习率设臵为,的特征采样率设臵为。评价指标关于评价指标,本文使用了两个广为人知的度量,即和。表示排名列表前个位臵电影排名的总收益,位臵处的定义如下是归化的,即,其中是可能的最高。基于本文的标签划分方式,即以排序列表中的名次为相关与非相关的界限,后面实验将采用来评双查询电影对作为个训练样例而型是以查询对应的所有电影序列即该查询下的所有查询电影对作为训练样例。等人对现阶段的排序学习研究进展进行了阐述。文献研究了多种基于的监督学习方法,并通过实验证实了较于传统方法的优越性......”

6、“.....它将大量独立基学习器通常是决策树的输出进行聚合。和于和均是在次独立实验下得出的平均值。表展示了以为基排序器和分别在,和测试集上的实验结果。采用业界基准作为子采样比例。从评价指标来看,在个数据集上的表现比普通方法要平均高出个百分点从评价指标来看,虽然表现不及,但是在个数据集上的表现依然比普通方法平均高出个百分文档列表,将这些文档按照预测与该查询的相关性从高到低进行排序。近年研究人员运用了监督机器学习技术来解决这个问题。在这项技术中,训练示例为查询文档对,对应的标签为相关性等级这就叫做排序学习。根据输入训练样例的不同,算法大致可分为型型和型种,。以电影为例,型是以单独的查询电影对作为个训练样例型是会根据输入数据集的查询数查询电影对数和特征数,通过自适应函数自动确定的子采样比例......”

7、“.....最后采用思想输出最终的双集成模型。实验结果显示,对比两个评价指标据集进行随机抽取,将其划分为,和个数据集进行实验。其中,训练集和测试集按的比例进行划分,具体信息见表。参数设臵方面,集成次数设臵为,基排序器集成次数设臵为,学习率设臵为,的特征采样率设臵为。评价指标关于评价指标,本文使用了两个广为人知的度量,即和。表示排名列表前个位臵电影排名的总收益,位臵处的定义如下是归化的,即。图分别展示了以作为基排序器和普通方法在个数据集上的值对比图。可以看到,在所有双集成模型中表现最好,其次是。而的预测性能在者中最差,可能原因是,由于是小规模数据集,在训练量不够大的情况下梯度会出现较多位臵移动上的判断,从而导致模型的精度有所下降......”

8、“.....也是算法的固有组成部分,其基本思想是从原始训练集中有放回的抽样来生成训练样本。的优势在于具有良好的数学特性对于集成学习,适当地使用可以减少模型方差。基于的排序学习方法在电影数据集中的应用电影论文。是组查询中平均精度值的平均值。而查询的是相关电影在排名列表每个位臵上精确度的平均值,其定义如下实验结果以下构建的个电影特征外,本文新构建类型系列其他大类小类特征,见表。这里的类型特征指的是电影属于什么类型如喜剧动作科幻等,系列特征指的是电影属于什么系列如速度与激情系列星球大战系列等。作者通过爬虫获取美国院线年月至年月,共个周末即个查询上映电影元数据,然后通过数据缺失值处理数据归化数据格式化,最终得到包含个特征的条排序学习格式即查询电影对格式的电影数据集。数据集的查询号代表电数和阶导数......”

9、“.....实验结果显示,基于的排序学习方法训练出的模型在评价指标和上的精确度基本处于以上,对排名预测有比较良好且稳定的效果。综上所述,本文以提高电影排序模型的性能为出发点,自建电影数据集,并提出种基于的自适应双集成排序学习方法。本文主要做了以下方面的工作对文献自建的电影数据集学习模型框架基于排序学习的电影检索系统大致分为两个阶段学习阶段和排序阶段,整体框架如图所示。其他集成模型,俗称,是种迭代决策树模型。每轮迭代产生棵决策树,下轮迭代会在上轮迭代树残差的基础上进行训练,这样通过不断减小误差来提高模型的精度。面向小数据集的自适应公式简介是现代统计学较为流行的种统计方法,是种重采样技术,也是算法的固有组成部分,其基本思想是从原始训练集中有放回的抽样来生成训练样本......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
基于RF的排序学习方法在电影数据集中的应用(电影论文).doc预览图(1)
1 页 / 共 8
基于RF的排序学习方法在电影数据集中的应用(电影论文).doc预览图(2)
2 页 / 共 8
基于RF的排序学习方法在电影数据集中的应用(电影论文).doc预览图(3)
3 页 / 共 8
基于RF的排序学习方法在电影数据集中的应用(电影论文).doc预览图(4)
4 页 / 共 8
基于RF的排序学习方法在电影数据集中的应用(电影论文).doc预览图(5)
5 页 / 共 8
基于RF的排序学习方法在电影数据集中的应用(电影论文).doc预览图(6)
6 页 / 共 8
基于RF的排序学习方法在电影数据集中的应用(电影论文).doc预览图(7)
7 页 / 共 8
基于RF的排序学习方法在电影数据集中的应用(电影论文).doc预览图(8)
8 页 / 共 8
预览结束,喜欢就下载吧!
  • 内容预览结束,喜欢就下载吧!
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档