成功加入购物车
图书条目标准图
正版品相完好,套书和多封面版本咨询客服后再下单
安俊秀 、 王鹏 、 靳宇倡 著 / 人民邮电出版社 / 2015-12 / 平装
售价 ¥ 10.64 2.4折
定价 ¥45.00
品相 九品
优惠 满包邮
延迟发货说明
上书时间2024-05-10
卖家超过10天未登录
Hadoop大数据处理技术基础与实践
全书共有12章,从Hadoop起源开始,介绍了Hadoop的安装和配置,并对Hadoop的组件分别进行了介绍,包括HDFS分布式存储系统,MapReduce计算框架,海量数据库HBase,Hive数据仓库,Pig、ZooKeeper管理系统等知识,最后对Hadoop实时数据处理技术作了简单介绍,旨在让读者了解当前的其它的大数据处理技术。本书除了对Hadoop的理论进行说明之外,还对如何使用各组件进行了介绍,但介绍的只是基础的使用,没有涉及到底层的高级内容,所以本书只是起一个引导作用,旨在让读者了解Hadoop并能够使用Hadoop的基本功能,并不是学习Hadoop的完全手册。
本书适用于高等院校的学生;是云计算专业、物联网专业及云计算与大数据专业的核心基础课程,也是计算机相关专业的一门新增专业课或选修课;适合于零售及云计算与大数据技术相关的培训班等使用。
安俊秀,女,教授,西安交通大学攻读计算机科学与技术专业,获工学硕士学位。中国计算机学会高级会员;中国电子学会高级会员;成都市科技攻关计划评审专家;成都军区项目评审专家;汕尾市科技顾问团首席顾问。
在科研工作方面,一直从事云计算与大数据、信息智能搜索与计算社会方面的研究工作。近五年来就此发表论文40余篇,其中**作者20余篇,核心期刊以上占15余篇。主编或参与完成专著3部、教材4部,6部由***出版社出版。获得国家发明专利2项(2014授权),实用新型专利授权12项。获得软件著作权13项。科研项目20项,其中作为项目负责人承担省部级项目3项;作为主研人员参与***项目6项、省级项目6项。
Hadoop基础与实践第1章Hadoop概述1.1 Hadoop来源和动机1.2 Hadoop体系架构1.3 Hadoop与分布式开发1.4 Hadoop行业应用案例分析1.4.1 Hadoop在门户网站的应用 1.4.2 Hadoop在搜索引擎中的应用 1.4.3 Hadoop在电商平台中的应用1.5小结第2章Hadoop安装与配置管理 2.1 实验准备 2.2 配置一个单节点环境 2.2.1 运行一个虚拟系统CentOS 2.2.2 配置网络 2.2.3创建新的用户组和用户 2.2.4上传文件到CentOS并配置Java、Hadoop环境 2.2.5 修改Hadoop2.2配置文件 2.2.6修改CentOS主机名 2.2.7绑定hostname与IP 2.2.8关闭防火墙 2.3节点之间的免密码通信 2.3.1什么是SSH 2.3.2 拷贝虚拟机节点 2.3.3 配置SSH免密码登录 2.4 Hadoop的启动和测试 2.4.1 格式化文件系统2.4.2启动HDFS2.4.3 启动Yarn2.4.4 管理JobHistory Server2.4.5 集群验证2.4.6 需要了解的默认配置2.5动态管理节点 2.5.1 动态增加和删除datanode 2.5.2 动态修改TaskTracker2.6小结第3章HDFS技术3.1HDFS的特点3.2HDFS架构3.2.1数据块3.2.2元数据节点与数据节点3.2.3辅助元数据节点3.2.4安全模式3.2.5负载均衡3.2.6垃圾回收3.3HDFS Shell命令3.3.1文件处理命令3.3.2dfsadmin命令3.3.3namenode命令3.3.4fsck命令3.3.5pipes命令3.3.6job命令3.4HDFS中Java API的使用3.4.1上传文件3.4.2新建文件3.4.3查看文件详细信息3.4.4下载文件3.5RPC通信3.5.1反射机制3.5.2代理模式与动态代理3.5.3Hadoop RPC机制与源码分析3.6小结第4章Map/Reduce技术4.1 什么是Map/Reduce4.2 Map/Reduce编程模型4.2.1 MapReduce编程模型简介4.2.2 Map/Reduce简单模型4.2.3 Map/Reduce复杂模型4.2.4 Map/Reduce编程实例–WordCount4.3 Map/Reduce数据流4.3.1分片、格式化数据源(InputFormat)4.3.2 Map过程4.3.3 Shuffle过程4.3.4 Reduce过程4.3.5文件写入(OutputFormat)4.4 Map/Reduce任务流程4.4.1 MRv2基本组成4.4.2 Yarn基本组成4.4.3 任务流程4.5 Map/Reduce的Streaming和Pipe4.5.1 Hadoop Streaming4.5.2 Hadoop Pipe4.6 Map/Reduce性能调优4.7Map/Reduce实战4.7.1 快速入门4.7.2简单使用Eclipse插件4.8小结第5章Hadoop I/O操作5.1HDFS数据完整性5.1.1校验和5.1.2DataBlockScanner5.2基于文件的数据结构5.2.1SequenceFile存储5.2.2MapFile5.2.3SequenceFile转换为MapFile5.3压缩5.3.1Codec5.3.2本地库5.3.3如何选择压缩格式5.4序列化5.4.1Writable接口5.4.2WritableComparable5.4.3Hadoop writable基本类型5.4.4自定义writable类型5.5小结第6章海量数据库HBase技术6.1 初识HBase6.2 HBase表视图6.2.1概念视图6.2.2物理视图6.3HBase物理存储模型6.4安装HBase6.4.1HBase单节点安装6.4.2HBase伪分布式安装6.4.3HBase完全分布式安装6.5HBaseShell6.5.1general一般操作6.5.2ddl操作6.5.3dml操作6.5.4小结6.6小结第7章ZooKeeper技术7.1 分布式协调技术7.2 实现者7.3 角色7.4 ZooKeeper数据模型7.4.1Znode7.4.2ZooKeeper中的时间7.4.3ZooKeeper节点属性7.4.4watch触发器7.5 ZooKeeper集群安装7.6 ZooKeeper主要Shell操作7.7 典型运用场景7.7.1数据发布与订阅7.7.2统一命名服务(Name Service)7.7.3分布通知/协调(Distribution of notification/coordination)7.8小结第8章分布式数据仓库技术Hive8.1 Hive出现原因8.2 Hive服务组成8.3 Hive安装8.3.1 Hive基本安装8.3.2 MySQL安装8.3.3 Hive配置8.4 Hive Shell介绍8.5HiveQL详解8.5.1 Hive管理数据方式8.5.2 Hive表DDL操作8.5.3 Hive表DML操作8.6小结第9章分布式数据分析工具Pig9.1 Pig的安装和配置9.2 Pig基本概念9.3 Pig保留关键字9.4使用Pig9.4.1 Pig命令行选项9.4.2 Pig的两种运行模式9.4.3 Pig相关Shell命令详解9.4.4Pig程序运行方式9.4.5 Pig输入与输出9.5模式(Schemas)9.6 Pig相关函数详解9.7小结第10章 Hadoop与RDBMS数据迁移工具Sqoop10.1 Sqoop基本安装10.2 Sqoop配置10.3 Sqoop相关功能10.4 Hive、Pig和Sqoop三者之间的关系10.5小结第11章Hadoop1.x与Hadoop2.x的比较11.1 Hadoop发展历程11.2 Hadoop1.x与Hadoop2.x之间的差异11.2.1 Hadoop1与Hadoop2体系结构对比11.2.2 Hadoop1与Hadoop2之间配置差异11.2.3 Hadoop2的Yarn框架11.2.4 HDFS联邦机制(Federation)11.3小结第12章Hadoop实时数据处理技术12.1 Storm-Yarn12.1.1 Apache Storm组成结构12.1.2 Storm数据流12.1.3 Storm-Yarn产生背景12.1.4 Storm-Yarn功能介绍12.2 Apache Spark12.2.1 Apache Spark组成结构12.2.2 Apache Spark扩展功能12.3 Storm与Spark的比较12.4小结附录一:使用Eclipse提交Hadoop任务相关错误解决附录二:常用Pig内置函数简介
展开全部
配送说明
...
相似商品
为你推荐
开播时间:09月02日 10:30