成功加入购物车

去购物车结算 X
翰林文轩旗舰店
  • hadoop大数据开发基础项目化教程 大中专理科化工  新华正版

hadoop大数据开发基础项目化教程 大中专理科化工 新华正版

举报

大中专理科化工 新华书店全新正版书籍 支持7天无理由

  • 装帧:    平装
  • 开本:    16开
  • 页数:    252页
  • 字数:    380千字
  • 出版时间: 
  • 版次:  1
  • 装帧:  平装
  • 开本:  16开
  • 页数:  252页
  • 字数:  380千字

售价 34.84 7.3折

定价 ¥48.00 

品相 全新品相描述

优惠 满包邮

优惠 满减券
    运费
    本店暂时无法向该地区发货

    延迟发货说明

    时间:
    说明:

    上书时间2023-07-18

    数量
    库存4
    微信扫描下方二维码
    微信扫描打开成功后,点击右上角”...“进行转发

    卖家超过10天未登录

    • 商品详情
    • 店铺评价
    手机购买
    微信扫码访问
    • 货号:
      xhwx_1202431290
      品相描述:全新
      正版特价新书
      商品描述:
      目录:

      项目1 大数据时代 1

      任务1 认识大数据 1

      1.1.1 大数据定义 2

      1.1.2 大数据核心特征 2

      1.1.3 大数据体系架构 3

      任务2 大数据关键技术 4

      1.2.1 大数据技术分类 4

      1.2.2 大数据存储基础 5

      1.2.3 大数据与云计算、物联网 6

      任务3 大数据的应用 6

      1.3.1 大数据典型应用—— 霍廷 6

      1.3.2 大数据典型应用—— 7

      1.3.3 大数据典型应用——城管通 7

      1.3.4 大数据典型应用——智能公交站牌 7

      1.3.5 大数据典型应用——金融分析 7

      1.3.6 大数据典型应用——医疗决策 7

      1.3.7 大数据典型应用——农业防稻瘟 8

      1.3.8 大数据典型应用——社会治理 8

      1.3.9 大数据典型应用——疫情阻击 8

      题 8



      项目2 hadoop基础环境 10

      任务1 熟悉linux 10

      2.1.1 linux简介 11

      2.1.2 linux发行版 11

      2.1.3 linux文件 11

      2.1.4 linux常用命令应用 12

      任务2 认识hadoop 15

      2.2.1 hadoop简介 15

      2.2.2 hadoop发展史 16

      2.2.3 hadoop发行版本 16

      2.2.4 hadoop基本概念 17

      2.2.5 hadoop的优点 18

      2.2.6 hadoop基本使用 19

      任务3 准备linux环境 20

      2.3.1 虚拟机简介 20

      2.3.2 vmware虚拟机 20

      2.3.3 安装虚拟机 20

      任务4 hadoop基础环境搭建 21

      2.4.1 hadoop核心知识 21

      2.4.2 hadoop生态社区 22

      2.4.3 安装主机master 24

      2.4.4 拍快照保留历史数据 28

      2.4.5 更改主机名称 29

      2.4.6 设置共享文件夹 32

      2.4.7 安装java并配置环境 35

      任务5 notepad++实现共享编辑 37

      2.5.1 notepad++简介 37

      2.5.2 下载并编辑notepad++ 37

      2.5.3 实现远程连接linux 39

      题 43



      项目3 hadoop环境搭建 45

      任务1 hadoop单节点环境搭建 45

      3.1.1 单节点基础 46

      3.1.2 单节点安装 46

      3.1.3 单节点配置环境及检验 47

      任务2 hadoop伪分布式环境搭建 49

      3.2.1 伪分布式环境基础 49

      3.2.2 伪分布式环境安装 51

      3.2.3 伪分布式环境配置及测试 53

      任务3 hadoop接近分布式环境搭建 60

      3.3.1 接近分布式环境基础 61

      3.3.2 接近分布式环境安装 62

      3.3.3 接近分布式环境配置 72

      任务4 使用xshell远程终端模拟器 78

      3.4.1 xshell简介 78

      3.4.2 xshell特点 78

      3.4.3 xshell下载和安装 78

      3.4.4 xshell远程连接虚拟机 79

      任务5 使用mobaxterm终端软件 83

      3.5.1 mobaxterm简介 83

      3.5.2 mobaxterm特点 84

      3.5.3 mobaxterm下载并安装 84

      3.5.4 使用mobaxterm连接虚拟机 85

      题 88



      项目4 分布式存储hdfs 90

      任务1 hdfs的组成与工作机制 90

      4.1.1 hdfs简介 91

      4.1.2 机架感知与副本冗余存储策略 91

      4.1.3 hdfs体系结构 92

      4.1.4 namenode工作 93

      4.1.5 查看namenode格式化后的数据文件 94

      任务2 hdfs数据作 96

      4.2.1 hdfs shell简介 96

      4.2.2 hdfs用户命令 97

      4.2.3 启动并查看hdfs进程 97

      4.2.4 借助浏览器查看 98

      4.2.5 hdfs管理员命令 99

      4.2.6 hdfs完成数据文件的简单作 100

      4.2.7 使用hdfs管理员命相关服务作 102

      任务3 创建hdfs项目 103

      4.3.1 idea开发工具使用 103

      4.3.2 idea安装 104

      4.3.3 借助idea创建maven项目 107

      任务4 hdfs的文件读写 109

      4.4.1 hdfs文件读写流程 110

      4.4.2 启动hadoop进程 111

      4.4.3 客户端向hdfs写文件 112

      4.4.4 客户端向hdfs读文件 114

      题 115



      项目5 mapreduce分布式编程 117

      任务1 认识mapreduce 117

      5.1.1 mapreduce介绍 117

      5.1.2 wordcount程序体验 118

      任务2 mapreduce编程模型 124

      5.2.1 mapreduce 设计构思和框架结构 124

      5.2.2 mapreduce 编程规范 126

      5.2.3 编写自己的单词统计程序 126

      任务3 mapreduce案例实战—— 去重 137

      5.3.1 数据去重思想 137

      5.3.2 mapreduce数据去重程序编写 138

      任务4 mapreduce案例实战—— 排序 145

      5.4.1 mapreduce数据排序 145

      5.4.2 shuffle工作 146

      任务5 mapreduce案例实战—— map端join 153

      5.5.1 map端join的使用场景 154

      5.5.2 map端join的执行流程 154

      任务6 mapreduce优化 162

      5.6.1 资源相关参数 162

      5.6.2 容错相关参数 163

      5.6.3 效率与稳定参数 163

      题 163



      项目6 hadoop数据仓库hive 165

      任务1 hive环境搭建 165

      6.1.1 hive简介 166

      6.1.2 hive优点 166

      6.1.3 安装mysql 166

      6.1.4 mysql基本应用 167

      6.1.5 安装hive 173

      6.1.6 配置hive环境 174

      6.1.7 启动hive 177

      任务2 hive数据库基本作 178

      6.2.1 数据库相关知识 179

      6.2.2 数据库作 179

      任务3 hive表基本作 181

      6.3.1 表的相关知识 181

      6.3.2 hive内置函数 182

      6.3.3 hive元数据存储 182

      6.3.4 表作 184

      题 189



      项目7 hadoop数据库hbase 190

      任务1 hbase安装配置基础 190

      7.1.1 hbase简介 191

      7.1.2 hbase发展历史 191

      7.1.3 hbase基本概念 191

      7.1.4 hbase特点 192

      7.1.5 hbase安装前的准备 193

      任务2 hbase多种模式安装 195

      7.2.1 hbase安装模式 195

      7.2.2 hbase常用命令 195

      7.2.3 hbase伪分布式安装及配置 196

      7.2.4 hbase接近分布式安装及配置 201

      任务3 hbase创建用户表 205

      7.3.1 hbase数据模型 205

      7.3.2 hbase存储机制 206

      7.3.3 hbase存储架构 206

      7.3.4 hbase表的基本命令 207

      7.3.5 创建用户表 207

      任务4 作表信息 209

      7.4.1 对表的作命令 209

      7.4.2 增加表记录 209

      7.4.3 查看表信息 210

      7.4.4 修改表结构 211

      7.4.5 更新表记录 213

      7.4.6 删除记录/表 214

      题 215



      项目8 协调系统zookeeper 216

      任务1 zookeeper基础知识 216

      8.1.1 zookeeper概述 217

      8.1.2 zookeeper基本概念 217

      8.1.3 zookeeper应用场景 218

      任务2 zookeeper安装基础 218

      8.2.1 zookeeper安装模式 218

      8.2.2 zookeeper角 219

      8.2.3 zookeeper常用命令 219

      8.2.4 zookeeper安装前准备 220

      任务3 zookeeper多种模式安装 222

      8.3.1 zookeeper配置中的参数 222

      8.3.2 单节点模式安装及配置 222

      8.3.3 伪集群模式安装及配置 227

      8.3.4 接近分布式模式安装及配置 232

      题 235



      参文献 237



      内容简介:

      hadoop是当前热门的大数据处理与分析台。hadoop大数据开发基础项目化教程将大数据台相关内容划分为8个项目,分别是大数据时代、hadoop基础环境、hadoop环境搭建、分布式存储hdfs、mapreduce分布式编程、hadoop数据仓库hive、hadoop数据库hbas、协调系统zookeeper,每个项目按照知识点拆解分为相关的多个任务,每个任务都有详细的作步骤实现,由浅入深、将理论和实践相融合,循序渐进地介绍hadoop集群的相关知识点,使读者能够学以致用,融会贯通,快速理解和掌握。本书可作为高职高专院校大数据技术及应用等计算机相关专业的教材使用,也适用于应用型本科院校数据科学与大数据、大数据管理与应用等专业的师生使用,还可供大数据零基础的初学者入门和、大数据相关领域的广大程序设计人员参。

      配送说明

      ...

      相似商品

      为你推荐

    孔网啦啦啦啦啦纺织女工火锅店第三课

    开播时间:09月02日 10:30

    即将开播,去预约
    直播中,去观看