成功加入购物车
顾立平 、 袁慧 著 / 科学技术文献出版社 / 2017-10 / 平装
售价 ¥ 4.00 1.4折
定价 ¥28.00
品相 八五品品相描述
优惠 满包邮
延迟发货说明
上书时间2023-07-17
卖家超过10天未登录
数据馆员的Hadoop简明手册
《数据馆员的Hadoop简明手册》旨在协助初级数据馆员们能够迅速了解Hadoop的知识、用途及整体概貌,作为进一步实践操作之前的入门基础读物。
本手册力求简单、通俗、易懂,既不泛泛之谈,也不过早深入细节,而是力求把握重点。事实上,唯有实践才能真正理解Hadoop的有趣之处和局限之处,但在实践之前,或者考虑选择架构之前,如果有这么一本手册,会容易理解、沟通及评估。
《数据馆员的Hadoop简明手册》包括5个部分。第1章概述分布式大数据的基本概念,以及开源软件Hadoop的历史、生态体系及主要版本的变化。第2章概述核心架构中的计算资源分配、列式计算的工具及索引。第3章概述分布式计算的MapReduce方案,这也是*为通用的一种方案,能满足海量数据的处理。第4章概述如何优化Hadoop的案例。*后,附录介绍Hado叩家族产品。
顾立平(Alan Ku),博士、教授。在中国科学院文献情报中心从事开放获取、著作权、数据权益的政策研究与建议;在中国科学院大学经济与管理学院讲授信息用户与服务研究。学术理念和工作信念是:好做事(态度)、做好事(方向)、做事好(目标)。
第1章 Hadoop概念1.1 Hadoop简介1.1.1 Hadoop是什么1.1.2 Hadoop形成的历史1.1.3 Hadoop在云计算和大数据中的地位1.1.4 Hadoop与Google FS的关系1.1.5 小结1.2 Hadoop生态系统1.2.1 Hadoop组成1.2.2 HDFS1.2.3 MapReduce1.3 Hadoop不同版本的变化1.3.1 Hadoop版本的变化1.3.2 HDFS→HDFS21.3.3 MapReduce 1.0→MapReduce 2.0第2章 Hadoop的YARN、HBase、Hive组件2.1 YARN2.1.1 YARN的基本组成结构2.1.2 YARN的工作流程2.2 HBase2.2.1 NoSQL数据库2.2.2 HBase分布式数据库2.3 Hive数据仓库系统2.3.1 Hive的定义2.3.2 Hive和数据库的异同2.3.3 部分查询逻辑实现举例第3章 MapReduce入门3.1 MapReduce初析3.2 MapReduce运行机制3.3 Map函数和Reduce函数3.4 Mapper和Reducer抽象类3.5 Maplkeduce的最小驱动类3.6 MapReduce的输入与输出3.6.1 MapReduce的输入InputFormat3.6.2 MapReduce的输出OutputFormat3.7 自定义Writable和WritableComparable3.8 技术详解3.8.1 Combiner详解3.8.2 Partitioner详解3.8.3 Distributed FileSystem详解3.9 Hadoop工具介绍3.10 Counter-计数器和自定义Counter计数器第4章 基于Hadoop二次开发实战4.1 MapReduce的优化4.2 Hadoop小文件优化4.3 任务调度附录 Hadoop家族产品
展开全部
配送说明
...
相似商品
为你推荐
开播时间:09月02日 10:30