hadoop大数据处理与分析教程(慕课版信息技术人才培养系列规划教材) 大中专理科计算机王秀友，丁小娜，刘运主编

作者: 王秀友，丁小娜，刘运主编
出版社: 人民邮电出版社
ISBN: 9787115530080
出版时间: 2021-02

版次: 1
装帧: 平装
开本: 16开
页数: 262页

作者: 王秀友，丁小娜，刘运主编
出版社: 人民邮电出版社
ISBN: 9787115530080

出版时间: 2021-02
版次: 1
装帧: 平装

开本: 16开
页数: 262页

售价 35.30 5.9折

定价￥59.80

品相全新品相描述

优惠

运费

本店暂时无法向该地区发货

延迟发货说明

时间：

说明：

上书时间2024-03-02

数量: 仅1件在售，欲购从速

立即购买加入购物车收藏

卖家超过10天未登录

商品详情
店铺评价

手机购买

微信扫码访问

商品分类：

计算机与互联网

货号：

303_9787115530080

品相描述：全新

正版特价新书

商品描述：

主编：

1.慕课版教材，各章节都配备了以二维码为载体的微课。2.配套资源丰富，包括课件、源代码、题库。3.教材厚度适中，难度较低，案例式，适合应用型本科和职业院校。

目录：

章绪论1

1．1认识大数据2

1．1．1大数据的定义2

1．1．2大数据的特点2

1．1．3大数据行业应用3

1．1．4hadoop与大数据5

1．1．5其他大数据处理台5

1．1．6大数据人才7

1．2什么是hadoop8

1．2．1hadoop简介8

1．2．2hadoop的发展历史8

1．2．3hadoop的特点9

1．3hadoop核心10

1．3．1分布式文件系统——hdfs11

1．3．2分布式计算框架——mapreduce13

1．4hadoop常用组件14

1．5hadoop在外的应用情况16

小结16

题16

第2章linux作系统的安装17

2．1virtualbox虚拟机的安装18

2．1．1virtualbox的下载和安装18

2．1．2设置virtualbox存储文件夹22

2．1．3在virtualbox中创建虚拟机24

2．2linux作系统简介28

2．2．1概述28

2．2．2特点28

2．2．3linux作系统的组成29

2．2．4linux基本命令31

2．2．5linux作系统的版本34

2．3linux作系统（ubuntu）的安装34

2．3．1linux作系统（ubuntu）的下载34

2．3．2安装ubuntu36

2．3．3启动ubuntu41

2．3．4设置终端42

2．3．5设置共享剪贴板45

2．3．6设置共享文件夹49

小结52

题52

第3章hadoop的伪分布式安装53

3．1k的检查与安装54

3．1．1检查是否安装k54

3．1．2安装k54

3．2配置ssh无密码登录58

3．3hadoop的下载与安装61

3．3．1hadoop的安装模式61

3．3．2hadoop的下载62

3．3．3hadoop的安装63

3．3．4配置hadoop前准备65

3．4hadoop环境配置66

3．4．1设置hadoop环境变量66

3．4．2修改hadoop配置文件68

3．4．3创建并格式化文件系统73

3．5启动hadoop73

3．6查看hdfsweb页面75

3．7查看yarnweb页面76

小结77

题77

第4章hadoop集群的搭建及配置78

4．1hadoop集群中节点角79

4．2设置集群前的准备工作80

4．2．1集群中节点的规划80

4．2．2设置网络81

4．3设置服务器83

4．3．1设置master服务器83

4．3．2复制虚拟机89

4．3．3设置slave服务器92

4．3．4设置master服务器到slave服务器的ssh无密码登95

4．3．5格式化文件系统96

4．4启动和关闭hadoop集群97

4．4．1启动和关闭hadoop集群97

4．4．2验证hadoop集群是否启动成功98

4．5查看hadoop集群的基本信息99

4．5．1查看集群的hdfs信息99

4．5．2查看集群的yarn信息101

4．6在hadoop集群中运行程序102

小结103

题103

第5章hadoophdfs命令104

5．1hdfs常用命令览105

5．2创建与查看hdfs目录105

5．2．1创建hdfs目录105

5．2．2查看hdfs目录106

5．3本地计算机和hdfs之间的文件复制107

5．3．1从本地计算机复制文件到hdfs107

5．3．2将hdfs上的文件复制到本地计算机110

5．4复制与删除hdfs文件112

5．5查看hdfs文件内容113

小结114

题114

第6章mapreduce编程入门115

6．1认识mapreduce116

6．1．1mapreduce的编程思想116

6．1．2mapreduce的运行环境118

6．2使用eclie创建mapreduce工程122

6．2．1下载与安装eclie122

6．2．2配置mapreduce环境127

6．3个mapreduce程序：wordcount131

6．3．1wordcount的设计思路131

6．3．2编写wordcount132

6．3．3分析wordcount程序140

6．3．4运行程序142

小结144

题144

第7章hive145

7．1hive简介146

7．1．1什么是hive146

7．1．2为什么使用hive146

7．1．3hive的体系结构146

7．1．4hive与关系型数据库的区别147

7．2安装元数据库148

7．2．1下载和安装mysql数据库148

7．2．2登录mysql数据库153

7．2．3使用mysql数据库153

7．3安装与配置hive156

7．3．1准备工作156

7．3．2下载hive156

7．3．3安装hive157

7．3．4配置hive158

7．3．5启动并验证hive161

7．4数据类型和存储格式162

7．4．1基本数据类型162

7．4．2复杂数据类型162

7．4．3存储格式163

7．4．4数据格式163

7．5hive中的数据定义164

7．5．1作数据库164

7．5．2查看与创建数据表166

7．5．3hive中其他的数据表169

7．5．4修改数据表170

7．5．5删除数据表171

7．6hive中的数据作171

7．6．1加载数据171

7．6．2插入数据174

7．6．3导出数据178

小结179

题179

第8章sqoop180

8．1安装并配置sqoop181

8．1．1下载并安装sqoop181

8．1．2配置sqoop183

8．1．3验证sqoop185

8．1．4测试sqoop与mysql的连接185

8．2sqoop命令186

8．3sqoop导入188

8．3．1使用sqoop把mysql数据导入hdfs189

8．3．2使用sqoop把mysql数据导入hive191

8．3．3有选择地导入数据192

8．4sqoop导出193

8．4．1使用sqoop将hadoop数据导出到mysql194

8．4．2使用sqoop将hive数据导出到mysql195

小结197

题197

第9章hbase198

9．1zookeeper集群的安装与配置199

9．1．1zookeeper简介199

9．1．2zookeeper安装199

9．1．3配置zookeeper集群201

9．1．4启动zookeeper集群204

9．2hbase集群的安装与配置206

9．2．1下载并安装hbase206

9．2．2配置hbase207

9．2．3启动并验证hbase211

9．3hbase的基本应用212

9．3．1创建表212

9．3．2插入数据213

9．3．3扫描全表的数据213

9．3．4获取某一行的数据213

9．3．5删除表213

小结213

题214

0章spark的介绍与安装215

10．1spark概述216

10．1．1spark系统架构216

10．1．2spark运行流程217

10．2安装与配置scala218

10．2．1下载scala218

10．2．2安装scala219

10．2．3启动与应用scala220

10．3安装与配置spark222

10．3．1安装模式222

10．3．2安装spark222

10．3．3配置环境变量224

10．3．4启动并验证spark226

10．4运行spark程序227

小结228

题228

1章综合案例——网络爬虫大数据分析229

11．1网络爬虫概述230

11．1．1网络爬虫230

11．1．2网络爬虫——快手爬票230

11．1．3开发语言选择231

11．2搭建python开发环境231

11．2．1开发环境概述231

11．2．2安装python232

11．3搭建qt环境235

11．3．1安装qt235

11．3．2安装pycharm开发工具237

11．4主窗体设计244

11．4．1qt拖曳控件244

11．4．2代码调试细节248

11．5分析网页请求参数251

11．6下载站名文件253

11．7车票信息的请求与显示255

11．7．1发送与分析车票信息的查询请求255

11．7．2主窗体中显示查票信息258

11．8hadoop中的网络爬虫261

小结262

题262

内容简介：

本书系统全面地介绍了有关hadoop的各类知识。全书共分11章，内容包括绪论、linux作系统的安装、hadoop的伪分布式安装、hadoop集群的搭建及配置、hadoophdfs命令、mapreduce编程入门、hive、sqoop、hbase、spark的介绍与安装、综合案例——网络爬虫大数据分析。全书每章内容都与实例紧密结合，有助于理解知识、应用知识，达到学以致用的目的。本书各章都配备了课程，并且在人邮学院台上提供了相应的慕课课程。此外，本书还提供了所有实例的源代码、制作精良的电子课件、重点及难点、在线测试题（包括选择题、填空题题库及自测试卷等内容）。其中，源代码经过精心测试，能够在ubuntu系统上编译和运行。本书可作为应用型本科院校计算机专业和软件工程专业、高职院校软件专业及相关专业的教材，同时也适合hadoop爱好者、初级的大数据开发人员参使用。
配送说明

...
相似商品
为你推荐

孔网分类

图书

图书

hadoop大数据处理与分析教程(慕课版信息技术人才培养系列规划教材) 大中专理科计算机 王秀友，丁小娜，刘运主编

孔网啦啦啦啦啦纺织女工火锅店第三课

hadoop大数据处理与分析教程(慕课版信息技术人才培养系列规划教材) 大中专理科计算机王秀友，丁小娜，刘运主编