hadoop大数据处理与分析教程(慕课版信息技术人才培养系列规划教材) 大中专理科计算机 王秀友,丁小娜,刘运主编
举报
-
作者:
王秀友,丁小娜,刘运主编
-
出版社:
人民邮电出版社
-
ISBN:
9787115530080
-
出版时间:
2021-02
-
版次:
1
-
装帧:
平装
-
开本:
16开
-
页数:
262页
-
作者:
王秀友,丁小娜,刘运主编
-
出版社:
人民邮电出版社
-
ISBN:
9787115530080
-
出版时间:
2021-02
-
版次:
1
-
装帧:
平装
售价
¥
35.30
5.9折
定价
¥59.80
品相
全新品相描述
上书时间2024-03-02
卖家超过10天未登录
手机购买
微信扫码访问
-
-
商品描述:
-
主编:
1.慕课版教材,各章节都配备了以二维码为载体的微课。2.配套资源丰富,包括课件、源代码、题库。3.教材厚度适中,难度较低,案例式,适合应用型本科和职业院校。
目录:
章绪论1
1.1认识大数据2
1.1.1大数据的定义2
1.1.2大数据的特点2
1.1.3大数据行业应用3
1.1.4hadoop与大数据5
1.1.5其他大数据处理台5
1.1.6大数据人才7
1.2什么是hadoop8
1.2.1hadoop简介8
1.2.2hadoop的发展历史8
1.2.3hadoop的特点9
1.3hadoop核心10
1.3.1分布式文件系统——hdfs11
1.3.2分布式计算框架——mapreduce13
1.4hadoop常用组件14
1.5hadoop在外的应用情况16
小结16
题16
第2章linux作系统的安装17
2.1virtualbox虚拟机的安装18
2.1.1virtualbox的下载和安装18
2.1.2设置virtualbox存储文件夹22
2.1.3在virtualbox中创建虚拟机24
2.2linux作系统简介28
2.2.1概述28
2.2.2特点28
2.2.3linux作系统的组成29
2.2.4linux基本命令31
2.2.5linux作系统的版本34
2.3linux作系统(ubuntu)的安装34
2.3.1linux作系统(ubuntu)的下载34
2.3.2安装ubuntu36
2.3.3启动ubuntu41
2.3.4设置终端42
2.3.5设置共享剪贴板45
2.3.6设置共享文件夹49
小结52
题52
第3章hadoop的伪分布式安装53
3.1k的检查与安装54
3.1.1检查是否安装k54
3.1.2安装k54
3.2配置ssh无密码登录58
3.3hadoop的下载与安装61
3.3.1hadoop的安装模式61
3.3.2hadoop的下载62
3.3.3hadoop的安装63
3.3.4配置hadoop前准备65
3.4hadoop环境配置66
3.4.1设置hadoop环境变量66
3.4.2修改hadoop配置文件68
3.4.3创建并格式化文件系统73
3.5启动hadoop73
3.6查看hdfsweb页面75
3.7查看yarnweb页面76
小结77
题77
第4章hadoop集群的搭建及配置78
4.1hadoop集群中节点角79
4.2设置集群前的准备工作80
4.2.1集群中节点的规划80
4.2.2设置网络81
4.3设置服务器83
4.3.1设置master服务器83
4.3.2复制虚拟机89
4.3.3设置slave服务器92
4.3.4设置master服务器到slave服务器的ssh无密码登95
4.3.5格式化文件系统96
4.4启动和关闭hadoop集群97
4.4.1启动和关闭hadoop集群97
4.4.2验证hadoop集群是否启动成功98
4.5查看hadoop集群的基本信息99
4.5.1查看集群的hdfs信息99
4.5.2查看集群的yarn信息101
4.6在hadoop集群中运行程序102
小结103
题103
第5章hadoophdfs命令104
5.1hdfs常用命令览105
5.2创建与查看hdfs目录105
5.2.1创建hdfs目录105
5.2.2查看hdfs目录106
5.3本地计算机和hdfs之间的文件复制107
5.3.1从本地计算机复制文件到hdfs107
5.3.2将hdfs上的文件复制到本地计算机110
5.4复制与删除hdfs文件112
5.5查看hdfs文件内容113
小结114
题114
第6章mapreduce编程入门115
6.1认识mapreduce116
6.1.1mapreduce的编程思想116
6.1.2mapreduce的运行环境118
6.2使用eclie创建mapreduce工程122
6.2.1下载与安装eclie122
6.2.2配置mapreduce环境127
6.3个mapreduce程序:wordcount131
6.3.1wordcount的设计思路131
6.3.2编写wordcount132
6.3.3分析wordcount程序140
6.3.4运行程序142
小结144
题144
第7章hive145
7.1hive简介146
7.1.1什么是hive146
7.1.2为什么使用hive146
7.1.3hive的体系结构146
7.1.4hive与关系型数据库的区别147
7.2安装元数据库148
7.2.1下载和安装mysql数据库148
7.2.2登录mysql数据库153
7.2.3使用mysql数据库153
7.3安装与配置hive156
7.3.1准备工作156
7.3.2下载hive156
7.3.3安装hive157
7.3.4配置hive158
7.3.5启动并验证hive161
7.4数据类型和存储格式162
7.4.1基本数据类型162
7.4.2复杂数据类型162
7.4.3存储格式163
7.4.4数据格式163
7.5hive中的数据定义164
7.5.1作数据库164
7.5.2查看与创建数据表166
7.5.3hive中其他的数据表169
7.5.4修改数据表170
7.5.5删除数据表171
7.6hive中的数据作171
7.6.1加载数据171
7.6.2插入数据174
7.6.3导出数据178
小结179
题179
第8章sqoop180
8.1安装并配置sqoop181
8.1.1下载并安装sqoop181
8.1.2配置sqoop183
8.1.3验证sqoop185
8.1.4测试sqoop与mysql的连接185
8.2sqoop命令186
8.3sqoop导入188
8.3.1使用sqoop把mysql数据导入hdfs189
8.3.2使用sqoop把mysql数据导入hive191
8.3.3有选择地导入数据192
8.4sqoop导出193
8.4.1使用sqoop将hadoop数据导出到mysql194
8.4.2使用sqoop将hive数据导出到mysql195
小结197
题197
第9章hbase198
9.1zookeeper集群的安装与配置199
9.1.1zookeeper简介199
9.1.2zookeeper安装199
9.1.3配置zookeeper集群201
9.1.4启动zookeeper集群204
9.2hbase集群的安装与配置206
9.2.1下载并安装hbase206
9.2.2配置hbase207
9.2.3启动并验证hbase211
9.3hbase的基本应用212
9.3.1创建表212
9.3.2插入数据213
9.3.3扫描全表的数据213
9.3.4获取某一行的数据213
9.3.5删除表213
小结213
题214
0章spark的介绍与安装215
10.1spark概述216
10.1.1spark系统架构216
10.1.2spark运行流程217
10.2安装与配置scala218
10.2.1下载scala218
10.2.2安装scala219
10.2.3启动与应用scala220
10.3安装与配置spark222
10.3.1安装模式222
10.3.2安装spark222
10.3.3配置环境变量224
10.3.4启动并验证spark226
10.4运行spark程序227
小结228
题228
1章综合案例——网络爬虫大数据分析229
11.1网络爬虫概述230
11.1.1网络爬虫230
11.1.2网络爬虫——快手爬票230
11.1.3开发语言选择231
11.2搭建python开发环境231
11.2.1开发环境概述231
11.2.2安装python232
11.3搭建qt环境235
11.3.1安装qt235
11.3.2安装pycharm开发工具237
11.4主窗体设计244
11.4.1qt拖曳控件244
11.4.2代码调试细节248
11.5分析网页请求参数251
11.6下载站名文件253
11.7车票信息的请求与显示255
11.7.1发送与分析车票信息的查询请求255
11.7.2主窗体中显示查票信息258
11.8hadoop中的网络爬虫261
小结262
题262
内容简介:
本书系统全面地介绍了有关hadoop的各类知识。全书共分11章,内容包括绪论、linux作系统的安装、hadoop的伪分布式安装、hadoop集群的搭建及配置、hadoophdfs命令、mapreduce编程入门、hive、sqoop、hbase、spark的介绍与安装、综合案例——网络爬虫大数据分析。全书每章内容都与实例紧密结合,有助于理解知识、应用知识,达到学以致用的目的。本书各章都配备了课程,并且在人邮学院台上提供了相应的慕课课程。此外,本书还提供了所有实例的源代码、制作精良的电子课件、重点及难点、在线测试题(包括选择题、填空题题库及自测试卷等内容)。其中,源代码经过精心测试,能够在ubuntu系统上编译和运行。本书可作为应用型本科院校计算机专业和软件工程专业、高职院校软件专业及相关专业的教材,同时也适合hadoop爱好者、初级的大数据开发人员参使用。
孔网啦啦啦啦啦纺织女工火锅店第三课
开播时间:09月02日 10:30
即将开播,去预约
直播中,去观看