全新正版 假一赔十 可开发票
-
出版时间:
2022-07
-
装帧:
平装
-
开本:
16开
-
ISBN:
9787121437748
-
出版时间:
2022-07
售价
¥
92.37
6.3折
定价
¥146.00
品相
全新
上书时间2024-12-12
卖家超过10天未登录
-
-
商品描述:
-
作者简介
"徐葳,专注于大数据技术方向,属于国内较早一批从事大数据的开发者,拥有10年以上互联网公司软件研发经验。
曾任职于北京猎豹移动、中科院大数据技术研究院等企业。
曾为移动研究院、平安寿险、中信银行、花旗银行、中移在线等企业进行大数据技术企培。"
目录
基础篇
第1章 大数据的前世今生
1.1 什么是大数据
1.2 大数据产生的背景
1.3 大数据的4V特征
1.4 大数据的典型应用场景
1.5 大数据生态圈核心技术总览
技术篇
第2章 海量数据采集
2.1 为什么需要数据采集
2.2 数据形态
2.3 数据来源
2.4 数据采集规则
2.5 日志数据采集工具
2.5.1 对比常见的日志数据采集工具
2.5.2 Flume的原理及架构分析
2.5.3 Flume的应用
2.5.3.1 安装Flume
2.5.3.2 Hello World
2.5.3.3 【实战】日志汇总采集
2.5.4 Logstash的原理及架构分析
2.5.5 Logstash的应用
2.5.5.1 安装Logstash
2.5.5.2 【实战】Hello World案例
2.5.5.3 【实战】采集异常日志案例
2.5.6 Filebeat的原理及架构分析
2.5.6.1 Filebeat的由来
2.5.6.2 原理及架构分析
2.5.7 Filebeat的应用
2.5.7.1 安装Filebeat
2.5.7.2 【实战】采集应用程序日志
2.6 数据库数据采集工具
2.6.1 对比常见的数据库数据采集工具
2.6.1.1 数据库离线数据采集工具
2.6.1.2 数据库实时数据采集工具
2.6.2 Saoop的原理及架构分析
2.6.3 DataX的原理及架构分析
2.6.4 Sqoop的应用
2.6.4.1 安装Sqoop
2.6.4.2 Sqoop 常见参数
2.6.4.3 【实战】导入数据
2.6.4.4 【实战】导出数据
2.6.4.5 【实战】封装Sqoop脚本
2.6.5 Canal的原理及架构分析
2.6.6 Maxwell的原理及架构分析
2.6.7 Maxwell的应用
2.6.7.1 安装Maxwell
2.6.7.2 【实战】采集MySQL数据库的实时数据
2.7 网页数据采集工具
2.7.1 常见的网页数据采集工具
2.7.2 网页数据采集工具的原理及架构分析
2.8 物联网数据采集工具
……
内容摘要
本书提供了学习大数据技术及架构的一站式解决方案,覆盖了大数据生态圈中的完整技术体系,包括数据采集、数据存储、分布式资源管理、数据计算、数据分析、任务调度、数据检索、大数据底层基础技术和大数据集群安装与管理。
本书还介绍了多个企业级大数据应用案例(包括海量数据采集、“双十一”数据大屏、海量数据全文搜索系统等)和大数据平台架构案例(包括离线数据仓库架构、实时数据仓库架构、批流一体化数据仓库架构、数据中台架构、直播大数据平台架构、电商大数据平台架构等),可以帮助读者从全局角度理解大数据。
在本书中,技术内容基本上都是从零讲起的,结合原理和架构,以“图解+实战”的形式帮助读者轻松理解复杂的知识。
本书适合对大数据感兴趣的开发人员。无论读者是否接触过大数据开发,只要具备一定的Java开发基础,都可以通过本书快速理解大数据的核心技术栈和典型应用场景,并且掌握海量数据的采集、存储、计算和分析等能力。
孔网啦啦啦啦啦纺织女工火锅店第三课
开播时间:09月02日 10:30
即将开播,去预约
直播中,去观看