帮帮文库

返回

(终稿)网页序列分析系统课程设计论文.doc(最终版) (终稿)网页序列分析系统课程设计论文.doc(最终版)

格式:word 上传:2022-06-25 08:25:46

《(终稿)网页序列分析系统课程设计论文.doc(最终版)》修改意见稿

1、“.....形式为三列,分别是用户号,用户点击的网页号,点击网页的次序号。取部分处理好的结果如下二〇五年月十四日星期三开头是加上的字段名。表达的含义是号用户第到第五次分别点击号网页。这个数据就可以用进行处理分析了。第四章数据模型构建二〇五年月十四日星期三数据流的构建打开软件,在源选项卡中选择可变文件节点,单击编辑,进行如下设置在文件设置中,导入处理好的数据,勾选读取文件中的字段名,在定界符中选项框中勾选逗号,新行在类型设置中,将字段设为无类型,设为集,设为范围。设置过程截图如下图导入数据二〇五年月十四日星期三图数据类型设置再点击选取表节点,连接可变文件,执行,观察数据是否正确导入了......”

2、“.....连接可变文件,上就是我们整个设计过程中需要注意的东西。最后在总结下我们这次设计中所用到的全部知识。预处理数据,分析数据,得出结果,设计推送系统。三大块的知识都很多,我们还要很多不足与欠缺的地方,但通过这次设计之后,我们定能向前更进步。二〇五年月十四日星期三目录第章绪论第二章数据基本分析数据说明质量分析基本描述分析第三章数据预处理数据处理过程数据预处理方法数据预处理结果第四章数据模型构建数据流的构建第五章模型结果分析结果的分析处理结果合理性分析第六章应用系统设计模型接口人机接口软件测试结论参考文献结束语二〇五年月十四日星期三第章绪论由于网站的结构设计,对特定用户而言信息获取的代价与所经过的浏览路径长度成正比......”

3、“.....本文利用数据挖掘的方法和技术对用户所访问的页面序列进行挖掘,构建网页推荐的模型,实现对当前站点排序方式的优化,从而最大限度地优化用户访问体验,提高当前站点信息获取的整体效率。关键词网页推荐数据挖掘访问序列传统的网站以系统自身为中心,为了容纳大量的信息,以图结构组织网站,页面之间存在着比较复杂的层次关系。这些预先设计好的浏览路径网站的结构严格按照设计者编辑好的层次返回页面,因此,为了获取特定的信息,从同页面出发的所有用户都不得不重复地经过很多与自己毫无关系的不希望看到的中间链接页面,使得用户为了获取少量的信息付出较大的代价。如果在确保网页内容的前提下,实现网站物理结构的调整和再组织,就可以避免混乱。站点路径优化实际上就是站点管理者优化其站点结构......”

4、“.....二〇五年月十四日星期三第二章数据基本分析数据说明本数据来自网络信息服务网站和年月日全天日志记录,每行连续数据表示单个用户小时内浏览网页的记录,连续数据中的数字表示用户对相应网页的浏览请求,该访问请求不会被记录成详细的记录,即具体的网址,而只是单单记录了网页类型。这些网页类型分别是到分析处理的要求。结合提供的数据具体分析每行数据是个用户的信息记录,表示的含义是第号用户点击了哪个网页,是第几次点击的。举出部分数据样例如下因为此次任务是进行序列关联分析,所以用户只进行了次点击情况的记录可以直接删除,比如样例中号用户。又因为最终要进行的操作是推送下个可能点击的网页,如果用户只是在不断的点击同个网页......”

5、“.....故也要剔去,如样例中号用户。还有种情况就是在多次点击过程中有重复点击的网页,这样的情况只需选取次即可,因为我们所关系的是网页点击的次序而不是次数,现对样例中号用户的数据进行分析,用户第次点击号网页,第二次点击号网页,第三次点击号网页,第四次点击号网页。根据以上的要求,可将数据处理成三列,分别表示用户号,用户点击的网页号,此次点击的次序号。将处理好的数据保存在文件中等待处理即可。数据预处理方法根据数据处理过程,决定运用软件,进行编程处理,程序分析过程如下先取数据文本中行数据赋值给数组二〇五年月十四日星期三将数组按照空格分隔符分割,并将分割后数据转换为整型,赋值给数组。对数组中数据进行前后比较,如若相等,则将前个赋值为将数组中数据进行判断,大于......”

6、“.....将数组中数据个数大于的,按形式为三列,分别是用户号,用户点击的网页号,点击网页的次序号的格式写入文本文件。具体代码分析如下正在处理,请稍等,保存字符型数据数组保存行型数据数组保存无重复数据数组定义文本输入输出流打开文本数据。通过超高速缓冲器寄存器每个网页的服务请求不会被记录到服务日志,因此,它不会体现在数据中。质量分析此次分析的数据总共有,平均每个用户点击网页的次数是次,每个不同类型的网页有到个不同的网页地址。从数据的质量上看,这是个较大的数据集,数据的量足够大,可以用于数据的挖掘分析,且数据来源于,有足够可信度。用户平均点击网页的数据也有次,适合用于分析点击网页序列,每种类型的网页也有足够多的不同网址,符合客观要求。因此从数据质量上看......”

7、“.....基本描述分析截取部分数据如下二〇五年月十四日星期三每行代表个用户所点击的网页,此次选取的数据之中共有个不同类型的网页,分别是为了方便处理,将以上各个网页进行编号,分别为。第三行数据为例对单个用户的数据进行说明。用户第次点击号网页,第二次点击号网页,第三次点击号网页,第四次点击号网页等次类推下去。每行都是个用户的记录二〇五年月十四日星期三第三章数据预处理数据处理过程此次任务是设计基于网页点击次序来推送下次可能点击的网页。选取的方法是的序列关联,所以要将数据处理成可读取的格式,并且要删减不必要的数据,改写数据的格式......”

8、“.....保存进数组这个数取最后个编号为推荐编号这个数取最大值头条新闻科技本地新闻舆论在线直播音乐天气健康二〇五年月十四日星期三家居商业体育体育概要旅行无关,可以将点击多次的相同网页减为次,最终将数据处理成了三列,这三列的含义分别是用户号,点击网页号,点击网页的次序号第二是利用来分析处理好的数据,现构建好数据流,选择可变文件节点,导入文件,设置好相应的设置,在使用序列节点,连接可变文件,进行相应的设置,执行便可得出相应的结果,然后将结果导出备用第三是设计推送系统部分,此部分使用开发工具进行开发。主要工作又包括两部分,是模型接口的设计,二是人机接口的设计。做好相应的窗体,能将分析得出的结果导入,根据结果进行比对分析,通过推送系统直接就可以得出相应的结果......”

9、“.....二〇五年月十四日星期三参考文献毛国军,段立娟数据挖掘原理与算法北京清华大学出版社,王婧,梁兴柱程序设计北京电子工业出版社,张世明程序设计基础北京人民邮电出版社,薛薇,陈欢歌数据挖掘方法及应用北京电子工业出版社,二〇五年月十四日星期三结束语这次课程设计,运用了多学科的知识,真可谓是大学学习的知识的综合运用。首先要对任务进行分析,先要处理好数据,这个过程可以运用各种工具和方法,只要能将数据处理成所需的结构即可。我们这次所选取来处理,通过编程将原始数据导入,在进行相应处理,导出结果。这个过程要对文件导入导出的语法很熟悉才行,同时还要了解数组函数等基本知识,部分函数可以在网上收索得到,灵活运用即可。然后就需要使用到数据处理的工具......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
网页序列分析系统课程设计论文.doc预览图(1)
1 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(2)
2 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(3)
3 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(4)
4 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(5)
5 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(6)
6 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(7)
7 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(8)
8 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(9)
9 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(10)
10 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(11)
11 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(12)
12 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(13)
13 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(14)
14 页 / 共 32
网页序列分析系统课程设计论文.doc预览图(15)
15 页 / 共 32
预览结束,还剩 17 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档