成功加入购物车

去购物车结算 X
南之大旧书店
  • 发货快!深度实践Spark机器学习 吴茂贵 郁明敏 朱凤云 张粤磊

发货快!深度实践Spark机器学习 吴茂贵 郁明敏 朱凤云 张粤磊

举报

二手书无附赠品!!若标题写套装书,请联系客服再下单

  • 作者: 
  • 出版社:    机械工业出版社
  • ISBN:    9787111589952
  • 出版时间: 
  • 版次:    1
  • 装帧:    平装
  • 开本:    16开
  • 纸张:    胶版纸
  • 页数:    234页
  • 字数:    99999千字
  • 作者: 
  • 出版社:  机械工业出版社
  • ISBN:  9787111589952
  • 出版时间: 
  • 版次:  1
  • 装帧:  平装
  • 开本:  16开
  • 纸张:  胶版纸
  • 页数:  234页
  • 字数:  99999千字

售价 9.03 1.3折

定价 ¥69.00 

品相 八五品

优惠 满包邮

优惠 满减券
    运费
    本店暂时无法向该地区发货

    延迟发货说明

    时间:
    说明:

    上书时间2024-01-12

    数量
    仅1件在售,欲购从速
    微信扫描下方二维码
    微信扫描打开成功后,点击右上角”...“进行转发

    卖家超过10天未登录

    • 商品详情
    • 店铺评价
    手机购买
    微信扫码访问
    • 商品分类:
      计算机与互联网
      货号:
      9787111589952
      商品描述:
      基本信息
      书名:深度实践Spark机器学习
      定价:69.00元
      作者:吴茂贵 郁明敏 朱凤云 张粤磊 杨本法等
      出版社:机械工业出版社
      出版日期:2018-03-01
      ISBN:9787111589952
      字数:150000
      页码:234
      版次:
      装帧:平装
      开本:16开
      商品重量:
      编辑推荐

      内容提要

      目录
      目  录?Contents前言章 了解机器学习  11.1 机器学习的定义  11.2 大数据与机器学习  21.3 机器学习、人工智能及深度学习  21.4 机器学习的基本任务  31.5 如何选择合适算法  41.6 Spark在机器学习方面的优势  51.7 小结  5第2章 构建Spark机器学习系统  62.1 机器学习系统架构  62.2 启动集群  72.3 加载数据  92.4 探索数据  102.4.1 数据统计信息  102.4.2 数据质量分析  112.4.3 数据特征分析  122.4.4 数据的可视化  172.5 数据预处理  192.5.1 数据清理  202.5.2 数据变换  212.5.3 数据集成  222.5.4 数据归约  232.6 构建模型  252.7 模型评估  262.8 组装  302.9 模型选择或调优  302.9.1 交叉验证  312.9.2 训练–验证切分  322.10 保存模型  322.11 小结  33第3章 ML Pipeline原理与实战  343.1 Pipeline简介  343.2 DataFrame  353.3 Pipeline组件  363.4 Pipeline原理  373.5 Pipeline实例  383.5.1 使用Estimator、Transformer和Param的实例  383.5.2 ML使用Pipeline的实例  403.6 小结  41第4章 特征提取、转换和选择  424.1 特征提取  424.1.1 词频—逆向文件频率(TF-IDF)  424.1.2 Word2Vec  434.1.3 计数向量器  444.2 特征转换  454.2.1 分词器  454.2.2 移除停用词  464.2.3 n-gram  474.2.4 二值化  484.2.5 主成分分析  484.2.6 多项式展开  504.2.7 离散余弦变换  504.2.8 字符串—索引变换  514.2.9  索引—字符串变换  534.2.10 独热编码  544.2.11 向量—索引变换  574.2.12 交互式  584.2.13 正则化  594.2.14 规范化  604.2.15 值—值缩放  604.2.16 值—值缩放  614.2.17 离散化重组  624.2.18 元素乘积  634.2.19 SQL转换器  644.2.20 向量汇编  654.2.21 分位数离散化  664.3 特征选择  674.3.1 向量机  674.3.2 R公式  694.3.3 卡方特征选择  704.4 小结  71第5章 模型选择和优化  725.1 模型选择  725.2 交叉验证  735.3 训练验证拆分法  755.4 自定义模型选择  765.5 小结  78第6章 Spark MLlib基础  796.1 Spark MLlib简介  806.2 Spark MLlib架构  816.3 数据类型  826.4 基础统计  846.4.1 摘要统计  846.4.2 相关性  846.4.3 假设检验  856.4.4 随机数据生成  856.5 RDD、Dataframe和Dataset  866.5.1 RDD  866.5.2 DatasetDataFrame  876.5.3 相互转换  886.6 小结  89第7章 构建Spark ML推荐模型  907.1 推荐模型简介  917.2 数据加载  927.3 数据探索  947.4 训练模型  947.5 组装  957.6 评估模型  967.7 模型优化  967.8 小结  98第8章 构建Spark ML分类模型  998.1 分类模型简介  998.1.1 线性模型  1008.1.2 决策树模型  1018.1.3 朴素贝叶斯模型  1028.2 数据加载  1028.3 数据探索  1038.4 数据预处理  1048.5 组装  1098.6 模型优化  1108.7 小结  113第9章 构建Spark ML回归模型  1149.1 回归模型简介  1159.2 数据加载  1159.3 探索特征分布  1179.4 数据预处理  1209.4.1 特征选择  1219.4.2 特征转换  1219.5 组装  1229.6 模型优化  1249.7 小结  1260章 构建Spark ML聚类模型  12710.1 K-means模型简介  12810.2 数据加载  12910.3 探索特征的相关性  12910.4 数据预处理  13110.5 组装  13210.6 模型优化  13410.7 小结  1361章 PySpark 决策树模型  13711.1 PySpark 简介  13811.2 决策树简介  13911.3 数据加载  14011.3.1 原数据集初探  14011.3.2 PySpark的启动  14211.3.3 基本函数  14211.4 数据探索  14311.5 数据预处理  14311.6 创建决策树模型  14511.7 训练模型进行预测  14611.8 模型优化  14911.8.1 特征值的优化  14911.8.2 交叉验证和网格参数  15211.9 脚本方式运行  15411.9.1 在脚本中添加配置信息  15411.9.2 运行脚本程序  15411.10 小结  1542章 SparkR朴素贝叶斯模型  15512.1 SparkR简介  15612.2 获取数据  15712.2.1 SparkDataFrame数据结构说明  15712.2.2 创建SparkDataFrame  15712.2.3 SparkDataFrame的常用操作  16012.3 朴素贝叶斯分类器  16212.3.1 数据探查  16212.3.2 对原始数据集进行转换  16312.3.3 查看不同船舱的生还率差异  16312.3.4 转换成SparkDataFrame格式的数据  16512.3.5 模型概要  16512.3.6 预测  16512.3.7 评估模型  16612.4 小结  1673章 使用Spark Streaming构建在线学习模型  16813.1 Spark Streaming简介  16813.1.1 Spark Streaming常用术语  16913.1.2 Spark Streaming处理流程  16913.2 Dstream操作
      作者介绍
      吴茂贵资深BI和大数据专家,就职于中国外汇交易中心,在BI、数据挖掘与分析、数据仓库、机器学习等领域有超过20年的工作经验,在Spark机器学习、TensorFlow深度学习领域大量的实践经验。郁明敏对大数据、机器学习有一定的研究,擅长Python、Hadoop、Spark等技术,曾获得“江苏省TI杯大学生电子竞技大赛”二等奖和全国大学生数学建模大赛二等奖。朱凤元毕业于香港浸会大学,获运筹学与商业统计硕士学位,毕业后在飞牛网、永安保险、麦芽金服等公司从事数据挖掘建模工作。张粤磊资深DBA和大数据架构师,10余年一线数据数据挖掘与分析实战经验。先后在咨询、金融、互联网行业担任数据平台技术负责人或架构师。杨本法高级算法工程师,在机器学习、文本挖掘、可视化等领域有多年实践经验。熟悉Hadoop生态圈的相关技术,在R、Spark方面有丰富的实战经验。
      序言

      配送说明

      ...

      相似商品

      为你推荐

    孔网啦啦啦啦啦纺织女工火锅店第三课

    开播时间:09月02日 10:30

    即将开播,去预约
    直播中,去观看