未读消息消息

店铺

我的订单收藏

拍卖

拍卖交易我的竞拍收藏

我的好友资金账户

客服 |

帮助中心 9:00-20:30 在线留言

客服电话

010-89648155

服务时间

客服咨询 8:00-21:00

纠纷处理 9:00-21:00

图书审核 9:00-18:00

监督与建议

请选择

手机孔网

成功加入购物车

去购物车结算 X

洪畅书店

商品分类

本店分类
孔网分类

32(200) 31(203) 30(175) 29(160) 28(228) 27(71) 26(181) 25(226) 24(246) 23(198) 22(216) H2-15(332) H2-14(92) 经管金融1(7) 家庭教育1(89) 党政1(76) 马列主义1(23) 健康生活(44) 政治1(20) 法律(18) 党政(1041) 健康生活(953) 家庭教育(628) Z 综合性图书(2868) X 环境科学安全科学(31) V 航空、航天(7) U 交通运输(8) T 工业技术(527) S 农业科学(74) R 医药卫生(292) Q 生物科学(22) P 天文学地球科学(27) O 数理科学和化学(17) N 自然科学总论(44) I 文学(5903) J 艺术(953) K 历史地理(1056) H语言文字(205) C社会科学总论(302) E军事(98) G文化教育科学体育(734) A马列主义(1) 政治(361) 哲学(1391) 经管金融(798) 青春言情(632) 【计算机互联网】(3) 【法律】(759) 科幻小说(139) 红色经典(147) 散文(784) 经典小说(609) 儿童系列书籍(2562) 儿童套装书籍(3530) 儿童套装书籍1-15列(2361) 古典文学(800) 成功心理学(934) 儿童综合图书(1210) 儿童文学(858) 少儿注音读物(2) 儿童绘本(725) 儿童教辅(639) 儿童国学(391) 儿童外语(763) 儿童百科(7)
特色

期刊(91) 外文古旧书(114)
图书

文学(11800) 童书(8490) 小说(4028) 教材教辅考试(3591) 哲学心理学(3485) 经济(2935) 生活(2766) 管理(1992) 历史(1867) 艺术(1773) 政治(1677) 综合性图书(1574) 社会文化(1523) 语言文字(989) 自然科学(935) 法律(890) 工程技术(834) 计算机与互联网(767) 医药卫生(629) 教育(486) 国学古籍(336) 军事(220) 体育(189) 地理(152) 宗教(132) 收藏与鉴赏(36)
艺术品藏品

连环画(2) 收藏杂项(1)

店铺首页全部商品最新上架店主推荐珍本图书优惠特价动态

手机逛本店

微信扫码访问

Lucene分析与应用

举报

吴众欣、沈家立著 / 机械工业出版社 / 2008-09 / 平装

售价 39.10

品相九品

优惠

优惠

运费

本店暂时无法向该地区发货

延迟发货说明

时间：

说明：

上书时间2023-07-27

数量: 仅1件在售，欲购从速

立即购买加入购物车收藏

卖家超过10天未登录

商品详情
店铺评价

手机购买

微信扫码访问

图书条目信息
图书 > 计算机与互联网
Lucene分析与应用
作者: 吴众欣著；沈家立著

出版社: 机械工业出版社

出版时间: 2008-09

版次: 1

ISBN: 9787111249924

定价: 39.00

装帧: 平装

开本: 16开

纸张: 胶版纸

页数: 279页

正文语种: 简体中文

丛书: 原创精品系列
内容简介：

　　本书对Lucene搜索引擎的源代码进行分析讲解，并用一些具体实例把所有源代码进行组织与剖析，完整地展示Lucene从建立索引到查询的过程。本书通过介绍Lucene的应用，分析Lucene具体项目开发的应用环境。最后简单地介绍了Nutch和Hadoop。
　　本书适用于开发搜索引擎的技术人员、Lucene爱好者等读者。

作者简介：

　　吴众欣，西安交通大学在读博士，主攻搜索引擎与服务组合。喜欢研读，头脑虽慢，滴水石穿。好奇心重，兴趣广泛。沈家立，2003年开始使用Java开发项目，主要从事电子商务和电子支付领域。喜欢研究开源项目，是bbs.wnetw.net的创建者之一，并担任BEA天津UserGroupLeader。

目录：

前言
第1章搜索引擎与Lucene
1.1搜索引擎与Lucene简介
1.1.1搜索引擎分类
1.1.2Lucene项目简介
1.1.3其他搜索引擎开发包介绍
1.2Lucene的系统架构
1.2.1Lucene最简示例
1.2.2Lueene采用的索引结构
1.2.3Lucene软件包架构
1.3本书的章节导航
第2章文档逻辑视图与文本分析
2.1文档逻辑视图
2.2Lucene的文本分析过程简介
2.3空格解析器（WhitespaceAnalyzer）
2.3.1空格分词器（WhitespaceTokenizer）
2.3.2Token（标志）
2.4标准解析器（StandardAnalyzer）
2.4.1标准分词器（StandardTokenizer）
2.4.2标准过滤器
2.5打造自己的解析器
2.5.1常用的中文分词法
2.5.2对CJKAnalyzer的分析
2.5.3构造自己的解析器
第3章Lucene创建索引之一（段索引方式与倒排索引结构）
3.1倒排结构与段索引方式
3.2索引写入过程概述
第4章Lucene创建索引之二（在内存中创建索引）
4.1创建Document层面索引
4.2写入field信息
4.3文件倒排过程
4.4填写postin，able
4.5postingTable的排序过程
4.6写入field名字文件（.fnm文件）
4.7写入field信息文件（.fdt，.fdx文件）
4.8写入频率与位置文件（.frq与.prx文件）
4.9TermVector方式写入索引（.tvf，.tvd与.tvx文件）
4.10字典文件（.tis与.tii文件）
4.11写入规格化文件
第5章Lucene创建索引之三（索引合并过程）
5.1document层面的合并过程
5.2field与term的合并过程
5.2.1field信息合并过程
5.2.2term信息合并过程
5.2.3合并norm信息
5.3Lunece索引采用的压缩算法
5.3.1frontcoding（端部编码）
5.3.2variable-bytecoding（变长字节编码）
5.3.3delta-coding或deha-encoding
5.4小结
第6章Lucene查询过程之一（查询模型与引擎预热）
6.1查询模型
6.1.1向量模型
6.1.2布尔模型
6.1.3Lucene的评分（score）方式
6.2查询简单示例
6.3引擎预热
6.3.1获得并打开索引文件
6.3.2获得segment信息
6.3.3FSDirectory打开索引过程
6.3.4获得field信息
6.3.5获得term信息
第7章Lucene查询过程之二（查询解析与语法）
7.1构建查询解析器（QueryParser）
7.2Lucene的查询语法
7.2.1项（Tcrm）查询
7.2.2域（Field）
7.2.3词条查询（TermModifiers）
7.2.4布尔操作符（BooleanOperator）
7.2.5组合查询（Grouping）
7.2.6针对field的组合查询（FieldGroupingField）
7.2.7EscapingSpecialCharacter（转义字符）
7.3Lucene查询语法树的构建过程
7.3.1过程分析
7.3.2语法树分析实例
第8章Lucene查询过程之三（相似度匹配与算法分析）
8.1查询与相似度计算
8.1.1查询器（Searcher）的查询过程
8.1.2查询语句的权重计算
8.1.3获得topK个document
8.2Lncene查询算法分析
8.2.1相似度计算简单实例
8.2.2线性相似度计算
8.2.3基于倒排索引的相似度计算
8.2.4Lucene的相似度计算
第9章Lucene标引与查询全程示例
9.1实例描述
9.2　建立索引过程
9.2.1选择文档中建立索引的.field
9.2.2选择field录入方式
9.2.3生成segment文件
9.2.4生成fields文件
9.2.5posting文件
9.2.6合并segmentindex生成index文件
9.2.7合并后的文件关系
9.3查询过程
第10章Lucene的常用应用场景分析
10.1对大型XML文档集合的检索
10.1.1都柏林文件介绍
10.1.2XML分析器介绍
10.1.3Lucene在大型XML文件中的应用
10.2MuhiSearcher的应用
10.2.1MultiSearcher的应用
10.2.2ParallelMuhiSearcher的应用
第11章利用Lucene构建分布式搜索引擎
11.1分布式文件系统和Hadoop
11.1.1Hadoop文件系统体系结构
11.1.2系统交互过程：单一NameNode方式
11.1.3系统组件描述
11.2Nutch简单剖析
11.3体验Nutch
附录ATestIndexWriterMerging
附录BTestDocumentWriter与DocHelper

展开全部
货号：

H3-16-6
配送说明

...
相似商品
为你推荐

本店分类

经管金融1(7)

家庭教育1(89)

马列主义1(23)

健康生活(44)

健康生活(953)

家庭教育(628)

Z 综合性图书(2868)

X 环境科学安全科学(31)

V 航空、航天(7)

U 交通运输(8)

T 工业技术(527)

S 农业科学(74)

R 医药卫生(292)

Q 生物科学(22)

P 天文学地球科学(27)

O 数理科学和化学(17)

N 自然科学总论(44)

I 文学(5902)

J 艺术(953)

K 历史地理(1056)

H语言文字(205)

C社会科学总论(302)

G文化教育科学体育(734)

A马列主义(1)

经管金融(798)

青春言情(632)

【计算机互联网】(3)

【法律】(759)

科幻小说(139)

红色经典(147)

经典小说(609)

儿童系列书籍(2562)

儿童套装书籍(3530)

儿童套装书籍1-15列(2361)

古典文学(800)

成功心理学(934)

儿童综合图书(1210)

儿童文学(858)

少儿注音读物(2)

儿童绘本(725)

儿童教辅(639)

儿童国学(391)

儿童外语(763)

儿童百科(7)

孔网分类

孔网特色

图书

艺术品收藏

孔网啦啦啦啦啦纺织女工火锅店第三课

开播时间：09月02日 10:30

即将开播，去预约

直播中，去观看