成功加入购物车
正版图书
李智慧 著 / 电子工业出版社 / 2021-07
售价 ¥ 29.60 3.3折
定价 ¥89.00
品相 全新
上书时间2021-12-25
大数据技术架构:核心原理与应用实践(博文视点出品)
在人工智能时代,不论是否从事大数据开发,掌握大数据的原理和架构早已成为每个工程师的必备技能。本书结合作者多年大数据开发、应用的经验,深入浅出地阐述大数据的完整知识体系,帮助读者从不同视角找到大数据方向的突破口,真正从普通开发者晋升为拥有大数据思维并能解决复杂问题的技术专家。本书一共分为7章,分别是大数据的前世今生与应用场景、Hadoop大数据原理与架构、大数据生态体系主要产品原理与架构、大数据开发实践、大数据平台与系统集成、大数据分析与运营、大数据算法与机器学习。本书既可作为初学者了解大数据技术的入门指南,也可作为有一定经验的工程师深入理解大数据思维的有益参考。
李智慧,同程旅行交通首席架构师。曾任阿里巴巴、Intel架构师,长期从事分布式系统与大数据开发,Apache Spark 代码贡献者,腾讯云 TVP,著有畅销书《大型网站技术架构:核心原理与案例分析》。
1 大数据的前世今生与应用场景 1大数据的前世今生:大数据简史与大数据生态体系概述 1从搜索引擎到人工智能:大数据应用发展史 6大数据应用的搜索引擎时代 6大数据应用的数据仓库时代 7大数据应用的数据挖掘时代 7大数据应用的机器学习时代 8数据驱动一切:大数据全领域应用场景分析 10大数据在医疗健康领域的应用 10大数据在社交媒体领域的应用 12大数据在金融领域的应用 13大数据在新零售领域的应用 13大数据在交通领域的应用 132 Hadoop大数据原理与架构 15移动计算比移动数据更划算 16从RAID看垂直伸缩到水平伸缩的演化 19新技术层出不穷,HDFS依然是存储的王者 23为什么说MapReduce既是编程模型又是计算框架 29MapReduce如何让数据完成一次旅行 33MapReduce作业启动和运行机制 34MapReduce数据合并与连接机制 37为什么把Yarn称为资源调度框架 39程序员应该如何学好大数据技术 443 大数据生态体系主要产品原理与架构 47Hive是如何让MapReduce实现SQL操作的 47用MapReduce实现SQL数据分析的原理 48Hive的架构 49Hive如何实现join操作 51人们并没有觉得MapReduce速度慢,直到Spark出现 53同样的本质,为何Spark可以更高效 57Spark的计算阶段 57Spark的作业管理 61Spark的执行过程 62BigTable的开源实现:HBase 63HBase可伸缩架构 64HBase可扩展数据模型 65HBase的高性能存储 66流式计算的代表:Storm、Spark Streaming、Flink 68Storm 68Spark Streaming 70Flink 71ZooKeeper是如何保证数据一致性的 74分布式一致性原理 75Paxos算法与ZooKeeper架构 76大数据技术应用场景分析 804 大数据开发实践 82如何自己开发一个大数据SQL引擎 83Panthera架构 83Panthera的SQL语法转换 84比如这条SQL 85Panthera程序设计 85Spark的性能优化案例分析 89Apache开源社区的组织和参与方式 90软件性能优化 91大数据开发的性能优化 91Spark性能优化 92案例1:Spark任务文件初始化调优 95案例2:Spark任务调度优化 98案例3:Spark应用配置优化 102案例4:操作系统配置优化 102案例5:硬件优化 103大数据基准测试可以带来什么好处 105大数据基准测试的应用 105大数据基准测试工具HiBench 107从大数据性能测试工具Dew看如何快速开发大数据系统 109Dew设计与开发 110Akka的原理与应用 112大数据开发实践的启示 1155 大数据平台与系统集成 117大数据平台 = 互联网产品 + 大数据产品 117数据采集 119数据处理 119数据输出与展示 119大数据任务调度 120大数据平台Lamda架构 120数据在大数据平台中的流转 121大数据从哪里来 123从数据库导入 123从日志文件导入 124前端埋点采集 126爬虫系统 128数据的熵 128知名大厂如何搭建大数据平台 129淘宝大数据平台 129美团大数据平台 130滴滴大数据平台 131学架构就是学架构模式 133盘点可供中小企业参考的商业大数据平台 134大数据解决方案提供商 134大数据云计算服务商 136大数据SaaS服务商 138大数据开放平台 138当大数据遇上物联网 139物联网应用场景分析 139物联网平台架构 140大数据技术在物联网中的应用 1416 大数据分析与运营 144老板想要监控什么运营指标 144互联网运营的常用数据指标 145数据可视化图表与数据监控 147一个用户新增下降的数据分析案例 150数据分析案例 151数据分析方法 154AB测试与灰度发布必知必会 156A/B测试的过程 157A/B测试的系统架构 158灰度发布 159如何利用大数据成为“增长黑客” 160Hotmail的增长黑客故事 161AARRR用户增长模型 161利用大数据增长用户数量 163为什么说数据驱动运营 1647 大数据算法与机器学习 168如何对数据进行分类和预测 168k近邻分类算法 169数据的距离 170文本的特征值 171贝叶斯分类 172如何发掘数据的关系 174搜索排序 174关联分析 177聚类 179如何预测用户的喜好 181基于人口统计的推荐 182基于商品属性的推荐 183基于用户的协同过滤推荐 184基于商品的协同过滤推荐 185机器学习的数学原理是什么 186样本 187模型 187算法 188为什么学机器学习要学数学 189从感知机到神经网络 190感知机 191神经网络 192
展开全部
配送说明
...
相似商品
为你推荐
开播时间:09月02日 10:30