1、“.....另外还会有个目录,这个目录很重要。通常在目录下有个文件和个目录,是这个应用的配置文件,而目录下则包含编译好的类和或所依赖的其它类如。通常这些所依赖的类也可以打包成放到下的目录下,当然也可以放到系统的中。在中,应用程序的部署很简单,你只需将你的放到的目录下,会自动检测到这个文件,并将其解压。你在浏览器中访问这个应用的时,通常第次会很慢,因为要将转化为文件......”。
2、“.....编译以后,访问将会很快。小节本章中详细介绍了如何构架基于的服务器,使得用户通过浏览器进行新闻的搜索,最后还对如何部署进行了说明。第六章搜索引擎策略简介随着信息多元化的增长,千篇律的给所有用户同个入口显然已经不能满足特定用户更深入的查询需求。同时,这样的通用搜索引擎在目前的硬件条件下,要及时更新以得到互联网上较全面的信息是不太可能的。针对这种情况,我们需要个分类细致精确数据全面深入更新及时的面向主题的搜索引擎......”。
3、“.....因此它比上面提到的前三代的搜索引擎将更加有效和准确,我们将这类完善的主题搜索引擎称为第四代搜索引擎。面向主题的搜索策略导向词导向词就是组关键词,它们会引导搜索器按照定顺序搜索整个网络,使得搜索引擎可以在最短的时间里面得到最全面的跟个主题相关的信息。通过协议基础上,而又是建立在协议之上,它同时也站点的文件清单和层次机构。还可以扫描出中断的超链接和拼写等......”。
4、“.....而更复杂的协议又建立在系统层协议之上。就是建立在有页面。基于因特网的搜索引擎是的最早应用。例如搜索巨头公司,就利用网络机器人程序来遍历站点,以创建并维护这些大型数据库。网络机器人还可以通过扫描站点的主页来得到这个么是网络机器人网络机器人又称为程序,是种专业的程序。用于查找大量的页面。它从个简单的页面上开始执行,然后通过其超链接在访问其他页面,如此反复理论上可以扫描互联网上的所性能指标进行了分析......”。
5、“.....在接下来的几章里将会就本人的设计进行详细的分析。第三章网络机器人什准确率次搜索结果中符合用户要求的数目与该次搜索结果总数之比相关度用户查询与搜索结果之间相似度的种度量精确度对搜索结果的排序分级能力和对垃圾网页的抗干扰能力小节以上对基于因特网的搜索引擎结构和的技术指标决定了搜索引擎的评价指标。好的搜索引擎应该是具有较快的反应速度和高召回率准确率的,当然这些都需要搜索引擎技术指标来保障......”。
6、“.....搜索引擎的主要指标及分析搜索引擎的主要指标有响应时间召回率准确率相关度等。这些指标决定了搜索引擎的技术指标。搜索引擎搜索引擎技术伴随着的发展是引人注目的。搜索引擎大约经历了三代的更新发展第代搜索引擎出现于年。这类搜索引擎般都索引少于个网页,极少重新搜集网页并去刷新索引。而且其检索速度非常慢......”。
7、“.....在实现技术上也基本沿用较为成熟的网络数据库等技术,相当于利用些已有技术实现的个上的应用。在年月到月,网络爬虫平均每天承受大约次查询。大约在年出现的第二代搜索引擎系统大多采用分布式方案多个微型计算机协同工作来提高数据规模响应速度和用户数量,它们般都保持个大约网页的索引数据库,每天能够响应次用户检索请求。年月,当时最先进的几个搜索引擎号称能建立从到的网页索引。搜索引擎声称他们每天大概要承受次查询。年搜索引擎年大会上......”。
8、“.....正在用,台运行系统的个人电脑在搜集上的网页,而且以每天台的速度向这个微机集群里添加电脑,以保持与网络的发展相同步。每台微机运行多个爬虫程序搜集网页的峰值速度是每秒个网页,平均速度是每秒个网页,天可以搜集超过网页搜索引擎词在国内外因特网领域被广泛使用,然而他的含义却不尽相同。在美国搜索引擎通常指的是基于因特网的搜索引擎,他们通过网络机器人程序收集上千万到几亿个网页,并且每个词都被搜索引擎索引,也就是我们说的全文检索......”。
9、“.....在中国,搜索引擎通常指基于网站目录的搜索服务或是特定网站的搜索服务,本人这里研究的是基于因特网的搜索技术。第二章搜索引擎的结构系统概述搜索引擎是根据用户的查询请求,按照定算法从索引数据中查找信息返回给用户。为了保证用户查找信息的精度和新鲜度,搜索引擎需要建立并维护个庞大的索引数据库。般的搜索引擎由网络机器人程序索引与搜索程序索引数据库等部分组成。系统结构图搜索引擎的构成网络机器人网络机器人也称为网络蜘蛛......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。