全新正版 假一赔十 可开发票
-
作者:
王沁晨
-
出版社:
清华大学出版社
-
ISBN:
9787302592549
-
出版时间:
2022-05
-
装帧:
平装
-
开本:
16开
-
ISBN:
9787302592549
-
出版时间:
2022-05
售价
¥
59.93
6.7折
定价
¥89.00
品相
全新
上书时间2024-01-16
卖家超过10天未登录
手机购买
微信扫码访问
-
-
商品描述:
-
作者简介
王沁晨,多伦多大学圣乔治校区计算机专业,曾在加拿大零售企业Loblaw Companies担任机器学习数据分析师,从公司传统的大型数据库中筛选有效信息、清理数据、人工数据挖掘、视化,到基础建模、模型优化、数据再筛选,再到结合商业需求创造扩展性强的实用管线,让项目从理论性的头脑风暴变现为商业价值。
目录
第1章预测分析与机器学习的实用价值
1.1人工智能、机器学习与数据分析的关系
1.2什么是预测分析
1.3预测分析在各行业中的应用
1.4预测分析流程概览
1.5小结
第2章数据清理
2.1建立编程环境
2.1.1Anaconda简介及安装
2.1.2Jupyter Notebook简介及安装
2.1.3Pandas简介及安装
2.1.4scikit-learn简介及安装
2.1.5XGBoost、LightGBM、CatBoost简介及安装
2.1.6TensorFlow简介及安装
2.2面对异构数据如何下手
2.2.1什么是异构数据
2.2.2如何处理异构数据
2.3数据误差
2.3.1各类数据误差及其影响
2.3.2如何处理数据误差
2.4数据重新格式化
……
内容摘要
本书从理解问题定义、了解数据内的高层信息、数据清理、视化数据,到基础建模、模型优化,分享一个数据分析师的视角与思路。在预测分析的流程中,一步步用详细的图文代码讲解使用到的库,如何正确使用各个库中的方法和函数,以及在遇到类似的问题时如何套用学过的知识。本书共8章。第1章对预测分析的流程进行一个高层次的概述。第2章介绍本书需要安装使用的库,并讲解数据清理步骤的执行。第3章讲解基础建模需考虑的细节,结合第4章的模型选择,可以搭建一个基础的预测管道。第5章和第6章分别从模型和数据的角度讲解如何优化预测表现。第7章讲解时间序列这一特殊数据的预测方法。最后,第8章总结全书学习到的内容,解决一个实战问题。本书面向3类读者。第1类,有编程基础但毫无数据科学背景,有意入门的读者;第2类,有数据科学理论基础,有意进入实操的读者,如刚毕业没有业界经验的学生;第3类,有数据科学理论基础与实操经验,但日常工作集中在数据分析管道中的数据分析师。
主编推荐
本书的着重点在于机器学习与预测分析的实战思路,其中加入算法或模型的理论知识介绍,让读者在学习如何进行运用的同时,更加深入的学习到为何在该实践场景下使用特定算法或模型。书中侧重讲解实操中常用、回报率高的算法。内容明了易懂,图文搭配,借鉴实际例子让学习过程更具实用感。
孔网啦啦啦啦啦纺织女工火锅店第三课
开播时间:09月02日 10:30
即将开播,去预约
直播中,去观看