第一图书网

搜索引擎

李晓明 科学出版社发行部
出版时间:

2005-4  

出版社:

科学出版社发行部  

作者:

李晓明  

页数:

247  

Tag标签:

无  

内容概要

本书系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述,到一个小型简单搜索引擎具体细节的实现,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后介绍了面向主题和个性化的web信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。 本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等专业的研究生或高年级本科生的教学参考书和技术资料,对广大从事网络技术、Web站点的管理、数字图书馆、Web挖掘等研究和应用开发的科技人员也有很高的参考价值。

作者简介

李晓明:天网搜索引擎领域负责人
闫宏飞 王继民:天网搜索引擎项目负责人

书籍目录

前言第一章 引论 第一节 搜索引擎的概念 第二节 搜索引擎的发展历史 第三节 一些著名的搜索引擎上篇 Web搜索引擎基本原理和技术 第二章 Web搜索引擎工作原理和体系结构  第一节 基本要求  第二节 网页搜集  第三节 预处理  第四节 查询服务  第五节 体系结构 第三章 Web信息的搜集 第一节  引言  一、超文本传输协议  二、一个小型搜索引擎系统  第二节 网页搜集  一、定义LJRL类和Page类  二、与服务器建立连接  三、发送请求和接收数据  四、网页信息存储的天网格式  第三节 多道搜集程序并行工作  一、多线程并发工作  二、控制对一个站点并发搜集线程的数目   第四节 如何避免网页的重复搜集   一、记录未访问、已访问IJRL和网页内容摘要信息  二、域名与IP的对应问题  第五节 如何首先搜集重要的网页  第六节 搜集信息的类型  第七节 本章 小结  第四章 对搜集信息的预处理 第一节 信息预处理的系统结构- 第二节 索引网页库 第三节 中文自动分词 第四节 分析网页和建立倒排文件 第五节 本章 小结 第五章 信息查询服务  第一节 查询服务的系统结构  第二节 检索的定义  第三节 查询服务的实现  一、结果集合的形成  二、查询结果显示  第四节 本章 小结中篇 对质量和性能的追求 第六章 可扩展搜集子系统  第一节 天网系统概述和集中式搜集系统结构   一、天网系统结构  二、集中式搜集系统  第二节 利用并行处理技术高效搜集网页的一种方案   一、节 点间URL的划分策略  二、关于性能的讨论  三、性能测试和评价  四、系统的动态可配置性设计 第三节 本章 小结 第七章 网页净化与消重 第一节 网页净化与元数据提取   一、引言  二、D0cview模型  三、网页的表示  四、提取Docview模型要素的方法  五、模型应用及实验研究 第二节 网页消重算法  一、消重算法…… 第八章 高性能检索子系统 第九章 用户行为的特征及缓存的应用 第十章 相关排序与系统质量评估下篇 面向主题和个性化的Wed信息服务 第十一章 中文网页自动分类技术 第十二章 搜索引擎个性化查询服务 第十三章 面向主题的信息搜集与应用参考文献附录 术语后记


图书封面

图书标签Tags

广告

下载页面


搜索引擎 PDF格式下载



理论联系实际,对深入了解搜索引擎的工作原理非常有用,遗憾的是对技术细节讨论不够充分


国内搜索引擎的书本来就少,这本书算是国内出版的最好的一本。书上内容结合了北大天网的实例来讲解说明,算是有理有据的,并非泛泛而谈。要知道天网搜索引擎算是国内的Numberone了。百度里面都是从天网招过去的,酷讯的老板干脆就是原来开发天网的。由此可知这本书的含金量是很高的。只是版本有点老,如果作者能重新出版,加入一些新的内容就更好了。


学习搜索引擎的原理和方法的好书,经典好书,值得推荐,作者还有系列相关书籍!


史上最经典的搜索引擎基础学习资料,详实,对学习SEO有相当大的帮助!


适合学习搜索引擎的同学阅读,要是有java版本就更好了


非常不错的一本搜索引擎教程,很值得一看!


这是一本非常好搜索引擎的入门书籍!


技术原理类的书 朋友推荐的 值得一看,这种工具类的书,只能在办公室书桌旁看,需要用心去思考和理解。


对天网有深刻的探索,比较系统,便于只是融合


图书馆借了好几次,最终决定买一本。很有收藏价值的书,相信以为一直会用到


内容一气呵成,非常流畅,由浅入深,适合初学者


感觉写的不错,才看到第六章。。。


买了好几本书,质量都不错,当当一如既往的好


基础知识,不错的一本书,推荐一下。


相当专业,在网上看人家推荐的,还可以


因为第二版有点贵,就选择了第一版。做seo的话还是需要多熟悉一下基础的内容。


封面不怎么喜欢,但是内容还行


真正的理解了搜索的内容,比那些抄算法的强多了


刚拿到手,匆匆翻阅了一下,感觉内容很实在,应该是一本好书,真正阅读的时候希望不要令人失望


书好,我喜欢,希望大家购买!


买来还没有看,应该还可以


在别人的博客中看见的,不错


讲的非常好 我一看就明白了


当当的送货速度真的很快...


不适合初学者啊 好难明啊


第一次读这类书,收获不小,对我有一定深度!


给先生买的,对工作有帮助,呵呵


这本书系统地介绍了搜索引擎的实现方法及原理,是了解搜索引擎知识的一本好书


学习seo首先要先系统的学习搜索引擎。知道了搜索引擎的工作原理才能让seo工作展开的更顺利,效果更明显。这本书虽然老了点,但是还是值得我们借鉴,看看就知道了,我也是从seo三人行那里得知的这本书。


对搜索引擎的研究综述和基本框架谈论的较为透彻,作为科研论文的参考文献是不错的。第6、7章在今日看来也不失指导价值,作者在圈内算是有资历的人了,写出的东西当然有意义。搜索引擎领域的仁人志士理应买一本看看。美中不足的是出版年份较早,有些内容过时了,希冀能有新版出现!


国内关于搜索引擎方面的书籍,本身就少,此书是非常好的搜索引擎方面的书籍,他不仅仅介绍理论,还有一个小的模型。关于中篇的介绍,要是在有实际的解决案例就好了


听seo三人行小涵推荐的,应该算是不错的了。里面很多公司,主要想学下搜索引擎的原理,想理解多一点百度。相信会有比较深刻的搜索引擎原理认识


刚开始学搜索引擎,这本书蛮不错的,很适合初学者。


这本书可以帮助读者很快的了解整个搜索引擎的框架结构


适合入门看,可以对搜索引擎有个整体了解


这个书,还是值得买的,如果你对搜索引擎不是很了解的话


本书介绍的较为详细,但不足的是没有自己编写的具体代码,用的是别人的开源项目,对于做项目的人来书,可以作为参考书,但是不能作为一本可以作为模板的设计辅助教材


对于入门来说是不错的,虽然原理老了点,但是大体方向还是不变的。


第一次用,很方便,价钱也说的过去!很好的互联网产品!赞


不错,只是有些内容希望写的再详细一些!


比较专业,正在研究中


内容不怎么生动,拿到这本书让我想起大学的古板的教科书。


这本书早几个月就买好了,放在家里一直没看,对书没什么评价,不过送货速度还蛮好的。


相对于其它几本来说,这本书还是不错的。。。。可以一看


但还是有点贵,这本书不是很厚啊,材料不足那么贵吧


好,但是可能要有基础的人才看得懂


2天内收到货 速度快


还没看,争取尽快看看


老师给过了,就好


顶!很难得的一本好书


质量、速度都还不错。


还不错,很容易看懂,就是版本老了点。对于入门者还是值得一看的。。。。不说了,看书去。


不错书很好~~~·~


从零开始教,还是蛮适合入门的


不错啊,还没看完


买了还没什么时间去看.


书的内容老了些,但是很经典


相比其它几款为了赚钱而推出的垃圾快餐书而言,这书算是不错的了对搜索引擎的理论有一个详细的介绍,适合入门但缺乏具体解决方案


这本书里面很多测试对比数据
因为这本书,我前几天就上天网看看,感觉很多内容搜不出来。
这难道就是国内最高水准的搜索引擎?
今天去看,暂停服务了。
网上好像有pdf版本的。


泛泛的技术介绍,算是了解了行业知识,开阔视野。


有一些参考价值,但是内容比较老


参考教材,需要慢慢体会


挺专业的对我这样的非专业的很难懂


书还OK,多加学习


写得中规中矩,内容不是很新颖,与其他书相近


像大学教材,粗略的看了一下,内容比较难,不适合初学者。


深不深,浅不浅,凑合看看吧,


只是外观略显陈旧,看上去像是二手书


如果用来入门还算可以吧!


深度是够了,看书的人就费劲了。需要提前掌握很多知识再看吧。


搞笑的是我买的一本居然还是装订错误的,搞的我还要去退掉。好象那5元邮费也没退给我。


入门的东西讲了点吧。


买了还没什么时间去看


买了一本,但是找不到源代码。在网上下载的代码不知道如何运行,书中也没有讲解,只是一味的讲解原理,不将如何搭建。该搜索引擎案例TES似乎是很多人知道,但我并不觉得好在哪里。那个什么北大的搜索也不外如是,似乎没什么人用。搜索出来的东西有些还没有


完全是大学教材一样的照本宣科


这一本更加差了,我不知道是盗版的还是因为出版社的原因
反正影响到了阅读了!


收到的书都搞到不像了麻烦给本新的好吗?


书还可以就是快递公司不太好书也被他们折出痕迹送货时间也慢


不错 适合新手


作为搜索引擎入门书非常好


非常基础


太基础了 哈哈


很不错哦啊


介绍搜索引擎技术的


相关图书