成功加入购物车

去购物车结算 X
灵感书店
  • 数据准备:从获取到整理

数据准备:从获取到整理

举报

正版保障 假一赔十 可开发票

  • 出版时间: 
  • 装帧:    平装
  • 开本:    16开
  • ISBN:  9787300307985
  • 出版时间: 
  • 装帧:  平装
  • 开本:  16开

售价 27.56 6.0折

定价 ¥46.00 

品相 全新

优惠 满包邮

优惠 满减券
    运费
    本店暂时无法向该地区发货

    延迟发货说明

    时间:
    说明:

    上书时间2024-01-16

    数量
    库存28
    微信扫描下方二维码
    微信扫描打开成功后,点击右上角”...“进行转发

    卖家超过10天未登录

    • 商品详情
    • 店铺评价
    手机购买
    微信扫码访问
    • 货号:
      11728243
      商品描述:
      作者简介
      阮敬 博士、教授、博士生导师。首都经济贸易大学数据科学学院副院长。兼任第七届全国统计教材编审委员会学术委员、数据科学与大数据应用组副组长,中国现场统计研究会副秘书长、经济与金融统计分会副理事长,中国统计教育学会副秘书长、高等教育分会秘书长,全国工业统计学教学研究会常务理事,中国青年统计学家协会创会秘书长,北京大数据协会副会长、秘书长,《统计学报》《统计与精算》编委等。研究领域为经济统计、大数据分析。在国内外发表论文70余篇,出版专著、译著、教材16部。主持***和省部级科研项目及企事业单位横向课题50余项。荣获全国统计科学研究优秀成果奖、全国应用统计专业学位研究生优秀教育教学成果奖、北京市哲学社会科学优秀成果奖、北京市优秀调查研究成果奖等10余项省部级及以上科研和教学奖励。任韬 博士、教授、博士生导师。首都经济贸易大学商务学院院长。兼任北京大数据协会副会长,中国商业统计学会常务理事、市场调查与教学研究分会副会长兼秘书长、数据科学与商业智能分会副会长,中国国民经济核算研究会常务理事等。主要研究方向为大数据分析,经济统计学。主持多项国家社会科学基金项目、教育部人文社会科学基金项目。在国内外发表学术论文20余篇,出版学术专著及教材7部。

      目录
      第1 章 数据来源1.1 调查和观察数据1.1.1 调查数据1.1.2 观察数据1.2 数据库数据1.2.1 关系型数据库1.2.2 非关系型数据库1.3 爬虫数据1.4 日志数据第 2 章 数据类型2.1 结构化数据2.1.1 基本数据类型2.1.2 二维表结构数据2.2 集合数据类型2.2.1 列表2.2.2 元组2.2.3 字典2.2.4 集合2.2.5 推导式2.3 其他常见的结构化数据2.3.1 数组2.3.2 矩阵2.3.3 数列2.3.4 数据帧2.3.5 日期时间型数据2.4 非结构化数据2.4.1 网页与 JSON 数据2.4.2 图像数据2.4.3 音频数据2.4.4 视频数据第 3 章 数据编码3.1 数据编码的基本要求和原则3.2 数据编码的结构类型3.2.1 分类编码3.2.2 顺序编码3.2.3 分段编码3.2.4 值标签编码3.2.5 Dummy/虚拟变量编码3.2.6 尺度编码第 4 章 数据清洗4.1 异常值清洗4.1.1 异常值识别4.1.2 异常值处理4.2 重复数据清洗4.2.1 重复数据检测4.2.2 重复数据删除4.3 低频类别清洗4.3.1 观察低频识别4.3.2 低频类别处理4.4 数据纠错4.4.1 逻辑纠错4.4.2 格式纠错4.5 数据纠偏4.5.1 数据偏度识别和测量4.5.2 数据偏度的纠正第5 章 数据插补5.1 缺失值产生原因及其表现5.1.1 缺失值的含义5.1.2 缺失值的类型5.1.3 缺失值产生的原因5.1.4 缺失值的影响5.1.5 缺失值的表现形式5.2 缺失值插补5.2.1 简单统计量插补5.2.2 聚类插补5.2.3 模型插补5.3 MVP5.3.1 MVP 分析思路5.3.2 MVP 提取方法第 6 章 数据配平6.1 不平衡数据6.1.1 不平衡数据的含义6.1.2 不平衡数据的影响6.2 数据配平方法6.2.1 欠采样6.2.2 过采样6.2.3 混合采样6.3 数据配平的影响6.3.1 数据配平的效果6.3.2 模型预测结果的偏离及其校正方法6.3.3 欠采样对预测稳定性的影响第 7 章 数据重构7.1 数据组合7.1.1 序列组合7.1.2 水平组合7.1.3 垂直组合7.1.4 深度组合7.1.5 列组合7.1.6 行组合7.2 轴向连接7.2.1 左右拼接7.2.2 数据追加7.3 数据融合7.3.1 键融合7.3.2 索引融合7.3.3 插补融合7.4 数据重塑7.4.1 Panel7.4.2 层次化索引7.4.3 stack与unstack7.5 数据分拆7.5.1 水平分拆7.5.2 垂直分拆7.5.3 深度分拆7.5.4 逻辑分拆7.5.5 随机采样与数据分割7.6 数据聚合第 8 章 数据变换8.1 数据变换的含义和作用8.2 连续数据函数变换8.2.1 对数变换8.2.2 平方根变换8.2.3 平方变换8.2.4 倒数变换8.2.5 幂变换与 BOX-COX 变换 1768.3 连续数据离散化8.3.1 客观法8.3.2 主观法8.4 数据次序化8.4.1 升降次序8.4.2 位置与秩8.4.3 秩的计算方法8.4.4 秩的缺失值处理8.4.5 DataFrame 中的秩8.5 多分类数据哑变量化8.5.1 哑变量的概念与特征8.5.2 哑变量与 one-hot 码8.5.3 多分类数据转换为哑变量 1968.5.4 多分类数据转换为 one-hot 码8.6 定性数据数量化8.6.1 顺序数据转化为得分8.6.2 构造定性数据的平滑值第 9 章 数据缩放9.1 数据缩放的概念9.2 数据缩放方法9.2.1 中心化9.2.2 标准化9.2.3 Min-Max 缩放9.2.4 Max-ABS 缩放9.2.5 Robust 缩放第 10 

      配送说明

      ...

      相似商品

      为你推荐

    孔网啦啦啦啦啦纺织女工火锅店第三课

    开播时间:09月02日 10:30

    即将开播,去预约
    直播中,去观看