Web数据挖掘:超文本数据的知识发现

作者: (印)查凯莱巴蒂著
出版社: 人民邮电出版社
ISBN: 9787115194046
出版时间: 2009-02
版次: 1

装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 344页
字数: 99999千字

作者: (印)查凯莱巴蒂著
出版社: 人民邮电出版社
ISBN: 9787115194046
出版时间: 2009-02

版次: 1
装帧: 平装
开本: 16开

纸张: 胶版纸
页数: 344页
字数: 99999千字

售价 16.00 2.7折

定价￥59.00

品相 九五品

优惠

运费

本店暂时无法向该地区发货

延迟发货说明

时间：

说明：

上书时间2024-03-22

数量: 仅1件在售，欲购从速

立即购买加入购物车收藏

卖家超过10天未登录

商品详情
店铺评价

手机购买

微信扫码访问

商品分类：

计算机与互联网

商品描述：

基本信息
书名:Web数据挖掘:超文本数据的知识发现
定价：59.00元
作者:(印)查凯莱巴蒂著
出版社：人民邮电出版社
出版日期：2009-02-01
ISBN：9787115194046
字数：432000
页码：344
版次：1
装帧：平装
开本：16开
商品重量：
编辑推荐

内容提要
本书是信息检索领域的名著，深入讲解了从大量非结构化Web数据中提取和产生知识的技术。书中首先论述了Web的基础(包括Web信息采集机制、Web标引机制以及基于关键字或基于相似性搜索机制)，然后系统地描述了Web挖掘的基础知识，着重介绍基于超文本的机器学习和数据挖掘方法，如聚类、协同过滤、监督学习、半监督学习，最后讲述了这些基本原理在Web挖掘中的应用。本书为读者提供了坚实的技术背景和的知识。本书是从事数据挖掘学术研究和开发的专业人员理想的参考书，同时也适合作为高等院校计算机及相关专业研究生的教材。
目录
1　INTRODUCTION　　1.1　Crawling and Indexing　　1.2 Topic Directories　　1.3 Clustering and Classification　　1.4 Hyperlink Analysis　　1.5 Resource Discovery and Vertical Portals　　1.6 Structured vs. Unstructured Data Mining　　1.7 Bibliographic NotesPART Ⅰ INFRASTRUCTURE　2　　CRAWLING THE WEB　　2.1 HTML and HTTP Basics　　2.2 Crawling Basics　　2.3 Engineering Large-Scale Crawlers　　　2.3.1 DNS Caching, Prefetching, and Resolution　　　2.3.2 Multiple Concurrent Fetches　　　2.3.3 Link Extraction and Normalization　　　2.3.4 Robot Exclusion　　　2.3.5 Eliminating Already-Visited URLs　　　2.3.6 Spider Traps　　　2.3.7 Avoiding Repeated Expansion of Links on Duplicate Pages　　　2.3.8 Load Monitor and Manager　　　2.3.9 Per-Server Work-Queues　　　2.3.10 Text Repository　　　2.3.11 Refreshing Crawled Pages　　2.4 Putting Together a Crawler　　　2.4.1 Design of the Core Components　　　2.4.2 Case Study: Using w3c-libwww　　2.5 Bibliographic Notes 3 WEB SEARCH AND INFORMATION RETRIEVAL　　3.1 Boolean Queries and the Inverted Index　　　3.1.1 Stopwords and Stemming　　　3.1.2 Batch Indexing and Updates　　　3.1.3 Index Compression Techniques　　3.2 Relevance Ranking　　　3.2.1 Recall and Precision 3.2.2　The Vector-Space Model　　 3.2.3　Relevance Feedback and Rocchio?s Method　　　　　3.2.4　Probabilistic Relevance Feedback Models　　　3.2.5　Advanced Issues　　　3.3　Similarity Search　　　　3.3.1　Handling òFind-Similaró Queries　　　　3.3.2　Eliminating Near Duplicates via Shingling　　　　3.3.3　Detecting Locally Similar Subgraphs of the Web　　　3.4　Bibliographic Notes　PART Ⅱ LEARNING PART Ⅲ APPLICATIONSReferencesIndex
作者介绍
Soumen Chakrabarti，Web搜索与挖掘领域的知名专家，ACM Transactions on the Web副主编。加州大学伯克利分校博士，目前是印度理工学院计算机科学与工程系副教授。曾经供职于IBM Almaden研究中心，从事超文本数据库和数据挖掘方面的工作。他有丰富的实际项目开发经验，开
序言
- 封面
  
  【封面】
配送说明

...
相似商品
为你推荐

孔网分类

图书

图书

Web数据挖掘:超文本数据的知识发现

孔网啦啦啦啦啦纺织女工火锅店第三课