成功加入购物车

去购物车结算 X
日日阅读书店
  • 大数据处理--从采集到可视化(高等学校信息管理学专业系列教材)
图文详情

大数据处理--从采集到可视化(高等学校信息管理学专业系列教材)

举报
  • 作者: 
  • 出版社:    武汉大学
  • ISBN:    9787307215146
  • 出版时间: 
  • 装帧:    平装
  • 开本:    16开
  • 作者: 
  • 出版社:  武汉大学
  • ISBN:  9787307215146
  • 出版时间: 
  • 装帧:  平装
  • 开本:  16开

售价 23.01 6.1折

定价 ¥38.00 

品相 全新

优惠 满包邮

优惠 满减券
    发货
    承诺48小时内发货
    运费
    本店暂时无法向该地区发货

    延迟发货说明

    时间:
    说明:

    上书时间2025-04-14

    数量
    库存2
    微信扫描下方二维码
    微信扫描打开成功后,点击右上角”...“进行转发

    卖家超过10天未登录

    • 商品详情
    • 店铺评价
    立即购买 加入购物车 收藏
    手机购买
    微信扫码访问
    • 商品分类:
      综合性图书
      货号:
      30962193
      商品描述:
      作者简介
      余肖生,博士,教授,三峡大学计算机学院教授,计算机学系书记,毕业于武汉大学信息管理学院。近年来发表各类学术论文30余篇,其中CSSCI源刊论文10余篇,多篇论文被EI、CPCI收录。

      目录
      章数据采集

      1.1大数据概念

      1.2大数据类型及特征

      1.3数据采集方法

      1.3.1问卷调查方法

      1.3.2网络用户数据收集方法

      1.3.3系统曰志采集方法

      1.3.4网络数据采集方法

      第2章数据清洗

      2.1数据质量维度

      2.2数据预处理之数据可能存在的问题

      2.3数据质量问题的原因分析

      2.3.1数据源数据质量问题的原因分析

      2.3.2数据分析阶段数据质量问题的原因分析

      2.4数据预处理之数据问题处理方法

      2.4.1变化量识别

      2.4.2错误拒绝

      2.4.3列清洗

      2.4.4行过滤

      2.5记录匹配算法

      ……


      内容摘要
      本书共分为9章,第一章数据采集,主要介绍了大数据的概念、类型及其特征,常见的数据采集方法;第2章数据清洗,主要讨论数据质量的维度,数据可能存在的质量问题,常见的数据清洗方法;第3章数据ETL,重点介绍了MGO方法;第4章数据存储,主要介绍了大数据时代的一些主流数据存储平台和相关技术;第5章回归算法,主要介绍了线性回归、决策树回归、随机森林回归等,并介绍了其实现的主要步骤以及相应的Python语言实现代码;第6章分类算法,主要介绍了逻辑回归二分类和多分类、度提升分类树等;第7章聚类算法,主要介绍了分割聚类、层次聚类、基于密度的聚类;第8章推荐算法,主要介绍了基于关联规则的推荐、基于内容过滤的推荐等主流方法;第9章数据可视化的关键技术,主要介绍了数据的降维、可视化隐喻及相关的交互技术。

      配送说明

      ...

      相似商品

      为你推荐

    孔网啦啦啦啦啦纺织女工火锅店第三课

    开播时间:09月02日 10:30

    即将开播,去预约
    直播中,去观看