成功加入购物车
[美] 克罗夫特 著; 刘挺 译 / 机械工业出版社 / 2010-06 / 平装
售价 ¥ 0.02
品相 九品
延迟发货说明
上书时间2025-08-18
卖家超过10天未登录
搜索引擎:信息检索实践
《搜索引擎:信息检索实践》介绍了信息检索中的关键问题,以及这些问题如何影响搜索引擎的设计与实现,很好地兼顾了信息检索理论以及搜索引擎的设计、实现和使用中的知识面广度与深度问题,重点关注于那些对于实现搜索引擎组件以及组件背后的信息检索模型最重要的部分,以及网络上使用的搜索技术。
《搜索引擎:信息检索实践》适合作为高等院校计算机科学或计算机工程专业本科生或研究生的教材。
克罗夫特(W.BruceCroft),马萨诸塞大学阿默斯特分校计算机科学特聘教授、ACM会士。他创建了智能信息检索研究中心,发表了200余篇论文,多次获奖,其中包括2003年由ACMSIGIR颁发的GerardSalton奖。
DonaldMetzler,马萨诸塞大学阿默斯特分校博士,是位于加州SantaClara的雅虎研究中心搜索与计算机广告组的研究科学家。
TrevorStrohman,马萨诸塞大学阿默斯特分校博士。他开发了Galago搜索引擎,也是Indri搜索引擎的主要开发者。
出版者的话译者序前言第1章搜索引擎和信息检索1.1什么是信息检索1.2重要问题1.3搜索引擎1.4搜索工程师参考文献和深入阅读练习第2章搜索引擎的架构2.1什么是软件架构2.2基本的构件2.3组件及其功能2.3.1文本采集2.3.2文本转换2.3.3索引的创建2.3.4用户交互2.3.5排序2.3.6评价2.4搜索引擎是如何工作的参考文献和深入阅读练习第3章信息采集和信息源3.1确定搜索的内容3.2网络信息爬取3.2.1抓取网页3.2.2网络爬虫3.2.3时新性3.2.4面向主题的信息采集3.2.5深层网络3.2.6网站地图3.2.7分布式信息采集3.3文档和电子邮件的信息采集3.4文档信息源3.5转换问题3.6存储文档3.6.1使用数据库系统3.6.2随机存取3.6.3压缩和大规模文件3.6.4更新3.6.5BigTable3.7重复检测3.8去除噪声参考文献和深入阅读练习第4章文本处理4.1从词到词项4.2文本统计4.2.1词表增长4.2.2估计数据集和结果集大小4.3文档解析4.3.1概述4.3.2词素切分4.3.3停用词去除4.3.4词干提取4.3.5短语和n元串4.4文档结构和标记4.5链接分析4.5.1锚文本4.5.2PageRank4.5.3链接质量4.6信息抽取4.7国际化参考文献和深入阅读练习第5章基于索引的相关排序5.1概述5.2抽象的相关排序模型5.3倒排索引5.3.1文档5.3.2计数5.3.3位置5.3.4域与范围5.3.5分数5.3.6排列5.4压缩5.4.1熵与歧义5.4.2Delta编码5.4.3位对齐码5.4.4字节对齐码5.4.5实际应用中的压缩5.4.6展望5.4.7跳转和跳转指针5.5辅助结构5.6索引构建5.6.1简单构建5.6.2融合5.6.3并行与分布式5.6.4更新5.7查询处理5.7.1document—at.a.time评价5.7.2term—at.a.time评价5.7.3优化技术5.7.4结构化查询5.7.5分布式的评价5.7.6缓存参考文献和深入阅读练习第6章查询与界面6.1信息需求与查询6.2查询转换与提炼6.2.1停用词去除和词干提取6.2.2拼写检查和建议6.2.3查询扩展6.2.4相关反馈6.2.5上下文和个性化6.3搜索结果显示6.3.1搜索结果页面与页面摘要6.3.2广告与搜索6.3.3结果聚类6.4跨语言搜索参考文献和深入阅读练习第7章检索模型7.1检索模型概述7.1.1布尔检索7.1.2向量空间模型7.2概率模型7.2.1将信息检索作为分类问题7.2.2BM25排序算法7.3基于排序的语言模型7.3.1查询项似然排序7.3.2相关性模型和伪相关反馈7.4复杂查询和证据整合7.4.1推理网络模型7.4.2Galago查询语言7.5网络搜索7.6机器学习和信息检索7.6.1排序学习7.6.2主题模型和词汇不匹配7.7基于应用的模型参考文献和深入阅读练习第8章搜索引擎评价8.1搜索引擎评价的意义8.2评价语料8.3日志8.4效果评价8.4.1召回率和准确率8.4.2平均化和插值8.4.3关注排序靠前的文档8.4.4使用用户偏好8.5效率评价8.6训练、测试和统计8.6.1显著性检验8.6.2设置参数值8.6.3在线测试8.7基本要点参考文献和深入阅读练习第9章分类和聚类9.1分类9.1.1朴素贝叶斯9.1.2支持向量机9.1.3评价9.1.4分类器和特征选择9.1.5垃圾、情感及在线广告9.2聚类9.2.1层次聚类和K均值聚类9.2.2K近邻聚类9.2.3评价9.2.4如何选择K9.2.5聚类和搜索参考文献和深入阅读练习第10章社会化搜索10.1什么是社会化搜索10.2用户标签和人工索引10.2.1搜索标签10.2.2推测缺失的标签10.2.3浏览和标签云10.3社区内搜索10.3.1什么是社区10.3.2社区发现10.3.3基于社区的问答10.3.4协同搜索10.4过滤和推荐10.4.1文档过滤10.4.2协同过滤10.5P2P搜索和元搜索10.5.1分布式搜索10.5.2P2P网络参考文献和深入阅读练习第11章超越词袋11.1概述11.2基于特征的检索模型11.3词项依赖模型11.4再谈结构化11.4.1XML检索11.4.2实体搜索11.5问题越长,答案越好11.6词语、图片和音乐11.7搜索能否适用于所有情况参考文献和深入阅读练习参考文献
展开全部
配送说明
...
相似商品
为你推荐
开播时间:09月02日 10:30