成功加入购物车
图书条目标准图
米洪 、张鸰 著 / 人民邮电出版社 / 2019-11 / 平装
售价 ¥ 6.90 1.7折
定价 ¥39.80
品相 八五品
优惠 满包邮
延迟发货说明
上书时间2023-08-17
卖家超过10天未登录
数据采集与预处理
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。
本书内容实用,可操作性强,语言精练、通俗易懂,可作为高等院校计算机应用技术、大数据技术与应用、软件技术、云计算技术与应用等计算机相关专业的教材,也可作为大数据分析、云计算应用领域技术人员的参考用书。
米洪,主持省级项目3项;发表北大核心论文5篇;学院交通物联网技术科技创新团队骨干成员;江苏省高等职业院校教师专业带头人访问学者(东南大学);江苏省高校“青蓝工程”优秀中青年骨干教师。
项目1数据采集与预处理准备 1学习目标 1项目描述 1任务1 认识数据采集技术,熟悉数据采集平台 1任务描述 1任务目标 2知识准备 2任务实施 10任务2 认识数据预处理技术 13任务描述 13任务目标 13知识准备 13任务实施 19项目2网络爬虫实践 24学习目标 24项目描述 24任务1 使用urllib爬取北京公交线路信息 24任务描述 24任务目标 25知识准备 25任务实施 48任务2 使用Selenium爬取淘宝网站信息 58任务描述 58任务目标 58知识准备 58任务实施 69任务3 使用Scrapy爬取北京公交信息 75任务描述 75任务目标 75知识准备 75任务实施 78任务4 创新与拓展 86任务描述 86任务目标 86项目3日志数据采集实践 87学习目标 87项目描述 87任务1 Flume的安装和配置 87任务描述 87任务目标 88知识准备 88任务实施 95任务2 Flume采集数据上传到集群 105任务描述 105任务目标 106知识准备 106任务实施 110任务3 创新与拓展 118任务描述 118任务目标 118项目4数据预处理实践 119学习目标 119项目描述 119任务1 用Pig进行数据预处理 119任务描述 119任务目标 120知识准备 120任务实施 134任务2 用Kettle进行数据预处理 137任务描述 137任务目标 137知识准备 137任务实施 139任务3 用Pandas进行数据预处理 150任务描述 150任务目标 150知识准备 150任务实施 153任务4 用OpenRefine进行数据预处理 155任务描述 155任务目标 155知识准备 155任务实施 157任务5 用Flume Interceptor对日志信息进行数据预处理 162任务描述 162任务目标 163知识准备 163任务实施 167任务6 创新与拓展 176任务描述 176任务目标 176
展开全部
配送说明
...
相似商品
为你推荐
开播时间:09月02日 10:30