本书系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述,到一个小型简单搜索引擎具体细节的实现,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后介绍了面向主题和个性化的Web信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。
目录
前言
第一章 引论
上篇 WEB搜索引擎基本原理和技术
第二章 WEB搜索引擎工作原理和体系结构
第三章 WEB信息的搜集
第四章 对搜集信息的预处理
第五章 信息查询服务
中篇 对质量和性能的追求
第六章 可扩展搜集子系统
第七章 网页净化与消重
第八章 高性能检索子系统
第九章 用户行为的特征及缓存的应用
第十章 相关排序与系统质量评估
下篇 面向主题和个性化的WEB信息服务
第十一章 中文网页自动分类技术
第十二章 搜索引擎个性化查询服务
第十三章 面向主题的信息搜集与应用
参考文献
附录. 术语
后记