成功加入购物车

去购物车结算 X
书山有路图书专营店
  • 数据清洗 清华大学出版社

数据清洗 清华大学出版社

举报

【保正版 出版社正版新书发货放心订购 支持团购】

  • 作者: 
  • 出版社:    清华大学出版社
  • ISBN:    9787302550877
  • 出版时间: 
  • 装帧:    平装
  • 开本:    16开
  • 页数:    408页
  • 出版时间: 
  • 装帧:  平装
  • 开本:  16开
  • 页数:  408页

售价 52.82 8.8折

定价 ¥59.90 

品相 全新

优惠 满包邮

优惠 满减券
    运费
    本店暂时无法向该地区发货

    延迟发货说明

    时间:
    说明:

    上书时间2024-02-26

    数量
    库存4
    微信扫描下方二维码
    微信扫描打开成功后,点击右上角”...“进行转发

    卖家超过10天未登录

    四年老店
    店铺等级
    拍卖等级
    资质认证
    90天平均
    成功完成
    93.96% (431笔)
    好评率
    99.94%
    发货时间
    11.44小时
    地址
    广东省惠州市惠阳区
    • 商品详情
    • 店铺评价
    立即购买 加入购物车 收藏
    手机购买
    微信扫码访问
    • 商品分类:
      管理
      货号:
      1203189387
      商品描述:
      内容简介
      数据清洗是大数据预处理的关键环节。面对错综复杂的数据,传统的清洗“脏”数据工作单调且异常辛苦,如果能利用正确的工具和方法,可以让数据清洗工作变得事半功倍。该书讲解数据清洗的理论知识和实际应用,全书共8章:第1章主要带领大家简单认识数据清洗;第2章主要讲解ETL技术相关的知识;第3章讲解Kettle工具的基本使用;第4章主要讲解数据清洗的第一步——数据抽取;第5章主要讲解数据清洗与检验;第6章主要讲解数据转换相关的知识;第7章主要讲解数据加载相关的知识;第8章利用前面章节所学的知识构建一个DVD租赁商店数据仓库,目的是实现定期从源数据库sakila中抽取增量数据,转换成符合DVD租赁业务的数据,最后加载到DVD租赁商店数据仓库中,便于后续在线DVD租赁商店的决策者对数据进行分析得出商业决策。该书附有配套视频、源代码、习题、教学设计、教学课件等资源。同时,为了帮助初学者更好地学习书中的内容,还提供了在线答疑,欢迎读者关注。本书可作为高等院校本专科计算机、信息管理等相关专业的大数据课程教材,也可供相关技术人员参考,是一本适合广大计算机编程爱好者的优秀读物。

      目录
      第1章数据清洗概述

       1.1数据清洗的背景

       1.1.1数据质量概述

       1.1.2数据质量的评价指标

       1.1.3数据质量的问题分类

       1.2数据清洗的定义

       1.3数据清洗的原理

       1.4数据清洗的基本流程

       1.5数据清洗的策略

       1.6常见的数据清洗方法

       1.7本章小结

       1.8本章习题

       第2章初识ETL

       2.1基于ETL的数据清洗

       2.1.1ETL的概念

       2.1.2ETL的体系结构

       2.2ETL关键技术

       2.2.1数据的抽取

       2.2.2数据的清洗转换

       2.2.3数据的加载

       2.3ETL常见工具介绍

       2.4本章小结

       2.5本章习题

       第3章Kettle工具的基本使用

       3.1Kettle简介

       3.1.1Kettle概述

       3.1.2Kettle的设计原则

       3.2Kettle的下载安装

       3.3Kettle的基本概念

       3.3.1转换

       3.3.2作业

       3.4Kettle的基本功能

       3.4.1转换管理

       3.4.2作业管理

       3.4.3数据库连接

       3.5本章小结

       3.6本章习题

       第4章数据抽取

       4.1抽取文本数据

       4.1.1TSV文件的抽取

       4.1.2CSV文件的抽取

       4.2抽取Web数据

       4.2.1HTML网页的数据抽取

       4.2.2XML文件的数据抽取

       4.2.3JSON文件的数据抽取

       4.3抽取数据库数据

       4.3.1抽取关系型数据库的数据

       4.3.2抽取非关系型数据库的数据

       4.4本章小结

       4.5本章习题

       第5章数据的清洗与检验

       5.1数据去重

       5.1.1接近去重

       5.1.2不接近去重

       5.2缺失值处理

       5.2.1缺失值清洗策略

       5.2.2去除缺失值

       5.2.3填充缺失值

       5.3异常值

       5.3.1出现异常值的原因

       5.3.2检测异常值

       5.3.3删除包含异常值的记录

       5.3.4修补异常值

       5.4数据检验

       5.4.1数据一致性处理

       5.4.2数据规范化处理

       5.5本章小结

       5.6本章习题

       第6章数据转换

       6.1多数据源的合并

       6.2不一致数据转换

       6.3数据粒度的转换

       6.4数据的商务规则计算

       6.5本章小结

       6.6本章习题

       第7章数据加载

       7.1数据的加载机制

       7.1.1全量加载

       7.1.2增量加载

       7.2数据的批量加载

       7.3本章小结

       7.4本章习题

       第8章综合案例——构建DVD租赁商店数据仓库

       8.1案例概述

       8.1.1案例背景介绍

       8.1.2数据仓库的架构模型

       8.1.3数据仓库效果预览

       8.2数据准备

       8.2.1数据库sakila的下载和安装

       8.2.2数据库sakila简介

       8.2.3数据表简介

       8.3案例实现

       8.3.1构建DVD租赁商店数据仓库

       8.3.2加载日期数据至日期维度表

       8.3.3加载时间数据至时间维度表

       8.3.4加载员工数据至员工维度表

       ……

      配送说明

      ...

      相似商品

      为你推荐

    孔网啦啦啦啦啦纺织女工火锅店第三课

    开播时间:09月02日 10:30

    即将开播,去预约
    直播中,去观看