doc JAVA面向主题的搜索引擎 ㊣ 精品文档 值得下载

🔯 格式:DOC | ❒ 页数:55 页 | ⭐收藏:0人 | ✔ 可以修改 | @ 版权投诉 | ❤️ 我的浏览 | 上传时间:2022-06-25 15:57

JAVA面向主题的搜索引擎

上,所以有远超过其它搜索引擎的新内容。也大量运用储存用户的个人搜索喜好设置。曾是随后几年最受欢迎的搜索引擎之,后被收购公司于年月成立于马萨诸塞州剑桥,年月,搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之,它没有,它有出色的,多出版物组成的良好的高级搜索语法,第个支持对搜索结果进行简单的自动分类。年月日,公共搜索引擎关闭,随后被收购,但在,选中,仍可使用搜索引擎年月之前,只是大学的个小项目。年博士生开始学习搜索引擎设计,于年月日注册了的域名,年底,在和的共同参与下,开始提供。年月,完成了从版到版的蜕变。公司则把年月日认作自己的生日。在动态摘要网页快照多文档格式支持地图股票词典寻人等集成搜索多语言支持用户界面等功能上的革新,象样,再次永远改变了搜索引擎的定义。在年中以前,虽然以搜索准确性备受赞誉,但因为数据库不如其它搜索引擎大,缺乏高级搜索语法,所以使用价值不是很高,推广并不快。直到年中数据库升级后,又借被选作搜索引擎的东风,才飞冲天。公司创立于年,是挪威科技大学学术研究的副产品。年月,发布了自己的搜索引擎。创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。的网页搜索可利用自动分类,支持和搜索,支持多语言搜索,还提供新闻搜索图像搜索视频和搜索,拥有极其强大的高级搜索功能。起源于年大学的个项目。教授带领华裔教授等人创立于新泽西,年春初次登场,年月被提问式搜索引擎收购,年月再次发布。的数据库目前仍偏小,但有两个出彩的功能支持类似自动分类的同时提供专业链接目录的。由韩裔创立。年春季发布版,年月日发布正式版,年月被分类目录提供商收购。也有两个出彩的功能包含类似自动分类和相关检索词的预览搜索结果的。由前工程师创立,年月展示版,年月日发布版。的数据库目前仍偏小,但也提供网页快照,个特色功能是即时索引网页,你的网页刚提交它就能搜索注这个的肉包子功能暂已关闭。创立于年月,其技术源自台湾中正大学吴升教授所领导的实验室。起先只做中文搜索引擎,曾经是最好的中文搜索引擎,鼎盛时期同时为三大著名门户新浪奇摩雅虎提供中文搜索引擎,但年后市场逐渐被和瓜分。年月,重新发布基于的搜索引擎版,推出多元排序,宣布累计抓取网页亿,开始进入英文搜索领域,此后技术升级明显加快。北大天网是国家九五重点科技攻关项目中文编码和分布式中英文信息发现的研究成果,由北大计算机系网络与分布式系统研究室开发,于年月日正式在上提供服务。年初成立天网搜索引擎新课题组,由国家重点基础研究发展规划项目基金资助开发,收录网页约万,利用教育网优势,有强大的搜索功能。年月,超链分析专利发明人前资深工程师李彦宏与好友徐勇加州伯克利分校博士在北京中关村创立了百度公司。年月发布搜索引擎版此前只为其它门户网站搜狐新浪等提供搜索引擎,年月日正式发布搜索引擎。虽然只提供中文搜索,但目前收录中文网页超过万,可能是最大的的中文数据库。搜索引擎的其它特色包括网页快照网页预览预览全部网页相关搜索词错别字纠正提示新闻搜索搜索信息快递搜索。年月闪电计划开始后,技术升级明显加快。未来搜索引擎技术将如何发展随着人工智能技术的进步成熟和信息服务的多样化,搜索引擎向着智能化个性化方向发展。随着眼球经济席卷互联网,成千上万的资金迅速流向最能吸引眼球的搜索引擎市场。有大量调查显示搜索引擎市场正处在高速发展时期,成为未来几年最具发展潜力的产业之。当你登录个网站,在互联网上搜索类内容,希望得到最新最全面的信息,你需要等待多长时间几年前,人们希望十几秒,最多秒钟就能得到结果,而现在的期望值是秒,也就是说,伴随鼠标的咔哒声,显示屏的页面已经变,排在最前面的十几二十条信息的标题已经出现在你的面前。目前,搜索引擎技术成为仅次于门户的互联网第二大核心技术,要用到信息检索人工智能计算机网络分布式处理数据库数据挖掘数字图书馆自然语言处理等多领域的理论和技术,所以具有综合性和挑战性。伴随互联网的普及和网上信息的爆炸式增长,它越来越引起人们的重视。检索结果深加工用户在使用搜索引擎进行信息搜索时,有时并不十分关注返回结果的多少,而是看检索结果是符合自己的需求。对于次普通查询,传统的搜索引擎动辄几十万几百万篇文档,这样的搜索结果是没有多大意义的。解决检索结果过多过杂的问题,目前有多种方法。是通过各种方法获得用户没有在检索式表达出来的真正目的,包括智能代理跟踪用户检索行为,分析用户操作模型,使用相关反馈机制,确定文档和用户需求的相关性,提高检索的精度。二是用文本分类技术,将结果分类,使用可视化技术显示分类结构,用户只浏览自己感兴趣的类别。三是进行站点聚类或内容聚类,减少信息的总量,从而有利于从大量返回结果中找到用户所需要的信息。提供个性化服务为了实现个性化服务,需要获取用户兴趣信息。获取用户的兴趣信息,有两种方法。在训练阶段,用信息论的观点对关键词分类并表示其特征程度关键词按贡献率分为积极特征词消极特征词和零特征词,然后定义标题的特征程度,并对各类特征词进行统计。在测试阶段,应用兴趣描述文件通常以文件格式存储,动态获取用户的兴趣从而把用户感兴趣的页面提供给用户。这种方法避免了用户描述兴趣的困难。用户很难描述兴趣,但可以判断篇文章是否符合需要。另种方法是可以根据用户的书签文件以及每次检索输入的关键词用户的反映来动态更新用户的兴趣。通过分析用户行为的意图,获取用户感兴趣的相关信息及感兴趣的感性程度。另外,用户输入的关键词也作为积极特征词来动态更新用户兴趣文件。基于智能搜索搜索引擎的智能化方向发展是毫无疑问的。智能搜索引擎是根据目前搜索引擎的发展趋势,除提供传统的全网快速检索相关度排序等功能外,还提供用户角色登记用户兴趣自动识别内容的语义理解智能化信息过滤和推送等功能,为用户提供个真正个性化智能化的网络信息搜集工具见图示。智能搜索引擎利用神经网络决策树关联规则范例推理模糊聚类粗糙集隐马尔科夫模型等技术实现分布式并行检索,以数据挖掘与知

下一篇
JAVA面向主题的搜索引擎第1页
1 页 / 共 55
JAVA面向主题的搜索引擎第2页
2 页 / 共 55
JAVA面向主题的搜索引擎第3页
3 页 / 共 55
JAVA面向主题的搜索引擎第4页
4 页 / 共 55
JAVA面向主题的搜索引擎第5页
5 页 / 共 55
JAVA面向主题的搜索引擎第6页
6 页 / 共 55
JAVA面向主题的搜索引擎第7页
7 页 / 共 55
JAVA面向主题的搜索引擎第8页
8 页 / 共 55
JAVA面向主题的搜索引擎第9页
9 页 / 共 55
JAVA面向主题的搜索引擎第10页
10 页 / 共 55
JAVA面向主题的搜索引擎第11页
11 页 / 共 55
JAVA面向主题的搜索引擎第12页
12 页 / 共 55
JAVA面向主题的搜索引擎第13页
13 页 / 共 55
JAVA面向主题的搜索引擎第14页
14 页 / 共 55
JAVA面向主题的搜索引擎第15页
15 页 / 共 55
温馨提示

1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

  • 文档助手,定制查找
    精品 全部 DOC PPT RAR
换一批