深入浅出Pandas:利用Python进行数据处理与分析
举报
正版图书 可以开电子发票 有需要的联系客服!
-
出版时间:
2021-07
-
装帧:
平装
-
开本:
16开
-
ISBN:
9787111685456
-
出版时间:
2021-07
售价
¥
46.90
4.7折
定价
¥99.00
品相
全新
上书时间2025-04-23
卖家超过10天未登录
-
-
商品描述:
-
前言
近年来,国内掀起了一股学习Python的热潮。作为一名互联网产品经理,我也不能免俗。凭借不错的学习能力,我很快就入了门,但接下来,用Python来干什么却成了问题,我因此迷茫了很久。后来我做数据相关的产品,经常要涉及数据采集、数据处理、数据分析等工作,总算有了相契合的使用场景。使用Python的时间越长,对Python的强大功能的体会就越深,于是我又把它推广到了团队。
这段从入门到实践的Python学习之旅也引发我思考:我们学习Python是在学什么?虽然听说Python什么都能做,但我发现,普通学习者在学习了Python的语法、数据类型、流程控制、函数、类等内容后,还是不知道Python能解决什么问题。
于是,我找到Python在全社会常见、广泛的使用场景,那就是收集数据、处理Excel表格、做数据分析,简单来说就是代替Excel的复杂操作,实现高效办公。而Pandas正是解决这方面问题的专业数据科学库。Pandas既能完成上述这些基础操作,又能在数据建模、机器学习等更高层次的领域发挥重要作用。
所以,对于Python的初学者,我都建议直接学Pandas,因为一来它能应对上述真实需求,学完就能解决问题;二来随着学习的深入,你会发现不论哪个领域都需要一个数据结构来承载数据,而Pandas提供的Series和DataFrame结构正好解决了这个问题。
读者对象
如同Python在诸多领域有广泛应用一样,Pandas处理的是数据问题,同样在各行各业都能展现其魅力,因此本书没有预设读者的行业和职业。阅读本书需要掌握一点Python的语法、数据结构和函数方面的基础知识,不过零基础的读者也完全可以理解本书的内容,本书会介绍Python环境的安装和Python的数据结构,方便初学者入门学习。阅读本书也不需要有专业的线性代数和概率统计学知识,只需具备基础的数学知识即可。
不过,还是强烈推荐以下人群阅读本书:
Excel中度、重度使用者,如文秘、公关人员、教师,从事行政、人力资源、市场和销售等工作的人员;
数据分析师、商业分析师、数据科学家;
互联网运营人员、数据运营人员;
互联网产品经理、项目经理;
开发人员、测试人员、算法人员;
财务、会计、金融从业者;
企业决策者、管理人员。
本书特色
不同于市面上众多由开发人员编写的Python图书,本书作者非技术人员出身,更能从用户体验角度入手解决学习者的痛点。本书有以下特色:
专注于介绍Pandas;
非技术思维,语言通俗易懂,面向应用;
不需要相关背景知识,不引入Python的高级用法;
减少变量的传递,代码短小精练;
覆盖知识全,几乎囊括了Pandas的所有函数和方法;
较少使用专业技术名词及统计学知识;
案例使用极简数据集,方便理解;
使用了流行的链式方法,代码简洁,逻辑清晰,可读性强;
有大量的实用案例。
为了减少篇幅,书中未展示部分不必要的输出结果,读者可自行执行代码查看结果。本书没有一一介绍一些方法的不重要参数,对有些同时适用于DataFrame和Series的方法也未重复介绍,读者可参考Pandas官方文档进一步学习。除了常规的系统学习外,还可以将本书作为工具书,在日常操作中随手查阅。本书也可作为技能培训教材,在教学中使用。
如何阅读本书
使用Pandas是一项技能,需要多动手实践才能熟练掌握。因此,阅读本书好的方法是紧跟书中的思路,对照书中的代码,自己输入电脑中运行,然后在工作和生活中发现应用场景,去解决实际问题。同时建议将本书所有的方法都过一遍,以了解各种工具的作用,这样遇到问题时心中才会有方案。后,建议多看看Pandas官方文档,学会看API说明,如果有能力,可以看看源码的实现,让自己对Pandas的掌握更上一层楼。
本书共17章,分为七部分,全面介绍了如何利用Pandas进行数据处理和数据分析。
部分(第1~2章) Pandas入门
主要介绍了Python和Pandas是什么,它们有哪些数据结构和数据类型,以及Pandas开发环境的搭建,此外还介绍了Pandas的快速入门。
第二部分(第3~5章) Pandas数据分析基础
主要介绍了Pandas读取与输出数据、索引操作、数据类型转换、查询筛选、统计计算、排序、位移、数据修改、数据迭代、函数应用等内容。
第三部分(第6~9章) 数据形式变化
主要介绍了Pandas的分组聚合操作、合并操作、对比操作、数据透视、转置、归一化、标准化等,还包括利用多层索引对数据进行升降维处理。
第四部分(第10~12章) 数据清洗
主要介绍了缺失值和重复值的识别、删除、填充,数据的替换、格式转换,文本的提取、连接、匹配、切分、替换、格式化、虚拟变量化等,还介绍了分类数据的应用场景和操作方法。
第五部分(第13~14章) 时序数据分析
主要介绍了Pandas中对于时间类型数据的处理和分析,包括固定时间、时长、周期、时间偏移等的表示方法、查询、计算、格式处理,以及时区转换、重采样、工作日和工作时间的处理方法。本部分还讲解了在时序数据处理中经常使用的窗口计算。
第六部分(第15~16章) 可视化
主要介绍了P
导语摘要
如果你想充分发挥Python的强大作用,如果你想成为一名好的Python工程师,你应该先学好Pandas。
这是一本全面覆盖了Pandas使用者的普遍需求和痛点的著作,基于实用、易学的原则,从功能、使用、原理等多个维度对Pandas做了全方位的详细讲解,既是初学者系统学习Pandas难得的入门书,又是有经验的Python工程师案头必不可少的查询手册。
本书共17章,分为七部分。
部分(第1~2章) Pandas入门
首先介绍了Pandas的功能、使用场景和学习方法,然后详细讲解了Python开发环境的搭建,Z后介绍了Pandas的大量基础功能,旨在引领读者快速入门。
第二部分(第3~5章) Pandas数据分析基础
详细讲解了Pandas读取与输出数据、索引操作、数据类型转换、查询筛选、统计计算、排序、位移、数据修改、数据迭代、函数应用等内容。
第三部分(第6~9章) 数据形式变化
讲解了Pandas的分组聚合操作、合并操作、对比操作、数据透视、转置、归一化、标准化等,以及如何利用多层索引对数据进行升降维。
第四部分(第10~12章) 数据清洗
讲解了缺失值和重复值的识别、删除、填充,数据的替换、格式转换,文本的提取、连接、匹配、切分、替换、格式化、虚拟变量化等,以及分类数据的应用场景和操作方法。
第五部分(第13~14章)时序数据分析
讲解了Pandas中对于各种时间类型数据的处理和分析,以及在时序数据处理中经常使用的窗口计算。
第六部分(第15~16章) 可视化
讲解了Pandas的样式功能如何让数据表格更有表现力,以及Pandas的绘图功能如何让数据自己说话。
第七部分(第17章) 实战案例
介绍了从需求到代码的思考过程,如何利用链式编程思想提高代码编写和数据分析效率,以及数据分析的基本方法与需要掌握的数据分析工具和技术栈,此外还从数据处理和数据分析两个角度给出了大量的应用案例及代码详解。
作者简介
李庆辉
数据产品专家,某电商公司数据产品团队负责人,擅长通过数据治理、数据分析、数据化运营提升公司的数据应用水平。
精通Python数据科学及Python Web开发,曾独立开发公司的自动化数据分析平台,参与*“1 X”数据分析(Python)职业技能等级标准评审。
中国人工智能学会会员,企业数字化、数据产品和数据分析讲师,在个人网站“盖若”上编写的技术和产品教程广受欢迎。
目录
内容摘要
如果你想充分发挥Python的强大作用,如果你想成为一名好的Python工程师,你应该先学好Pandas。
这是一本全面覆盖了Pandas使用者的普遍需求和痛点的著作,基于实用、易学的原则,从功能、使用、原理等多个维度对Pandas做了全方位的详细讲解,既是初学者系统学习Pandas难得的入门书,又是有经验的Python工程师案头必不可少的查询手册。
本书共17章,分为七部分。
部分(第1~2章) Pandas入门
首先介绍了Pandas的功能、使用场景和学习方法,然后详细讲解了Python开发环境的搭建,Z后介绍了Pandas的大量基础功能,旨在引领读者快速入门。
第二部分(第3~5章) Pandas数据分析基础
详细讲解了Pandas读取与输出数据、索引操作、数据类型转换、查询筛选、统计计算、排序、位移、数据修改、数据迭代、函数应用等内容。
第三部分(第6~9章) 数据形式变化
讲解了Pandas的分组聚合操作、合并操作、对比操作、数据透视、转置、归一化、标准化等,以及如何利用多层索引对数据进行升降维。
第四部分(第10~12章) 数据清洗
讲解了缺失值和重复值的识别、删除、填充,数据的替换、格式转换,文本的提取、连接、匹配、切分、替换、格式化、虚拟变量化等,以及分类数据的应用场景和操作方法。
第五部分(第13~14章)时序数据分析
讲解了Pandas中对于各种时间类型数据的处理和分析,以及在时序数据处理中经常使用的窗口计算。
第六部分(第15~16章) 可视化
讲解了Pandas的样式功能如何让数据表格更有表现力,以及Pandas的绘图功能如何让数据自己说话。
第七部分(第17章) 实战案例
介绍了从需求到代码的思考过程,如何利用链式编程思想提高代码编写和数据分析效率,以及数据分析的基本方法与需要掌握的数据分析工具和技术栈,此外还从数据处理和数据分析两个角度给出了大量的应用案例及代码详解。
主编推荐
李庆辉
数据产品专家,某电商公司数据产品团队负责人,擅长通过数据治理、数据分析、数据化运营提升公司的数据应用水平。
精通Python数据科学及Python Web开发,曾独立开发公司的自动化数据分析平台,参与*“1 X”数据分析(Python)职业技能等级标准评审。
中国人工智能学会会员,企业数字化、数据产品和数据分析讲师,在个人网站“盖若”上编写的技术和产品教程广受欢迎。
媒体评论
Python在大数据、人工智能领域的应用十分广泛,依托其丰富的数据科学生态库,我们可以高效地进行相关的理论研究和业务实践。作为Python数据科学的核心力量之一,Pandas是学习大数据、人工智能的基础工具。本书从理论到实践、深入浅出地对Pandas做了全面介绍,是非常合适的学习材料。——张军平 复旦大学计算机科学技术学院教授 Pandas是一款大数据领域的优秀工具,拥有非常广泛的应用场景。本书是一本全面讲解Pandas的优秀著作,不仅详细介绍了Pandas的数据采集、处理、展示等常见实践场景,而且给出了丰富的代码示例和运行效果,是理论和实践相结合的典范。——陈运文 博士/国家“万人计划”专家/达观数据CEO Pandas是一个快速、强大、灵活且易用的开源数据分析和操作工具,它建立在Python之上,已被广泛应用在统计分析和机器学习领域。它是建立数据分析管道的后一公里,熟练掌握它,我们就能从海量数据中高效提取关键信息。本书全面系统地介绍了Pandas的各种方法,并结合简洁、清晰的代码片段,辅以大量的应用案例,使我们能够深刻理解Pandas的设计理念,并掌握其使用方法,非常值得阅读。——耿杰森 美国数据工程与科学协会主席 作为Python的重度使用者,我将Pandas作为处理数据的主要工具库。本书覆盖了日常工作中的主要数据处理场景,详细介绍了众多的功能和方法,且内容深入浅出,简单易懂。本书既可以作为初学者的Pandas入门书,也可以作为Pandas高手随手查阅的工具书。——宋天龙 触脉咨询合伙人/《Python数据分析与数据化运营》作者 对于互联网时代的分析师而言,利用Python进行数据处理已经成为一项基础能力,而Pandas是Python中用来处理数据的核心库,因此我们十分有必要掌握它。本书深入浅出地介绍了Pandas的常见用法,推荐给想要系统学习Pandas的读者。——张俊红 《对比Excel,轻松学习Python数据分析》作者
孔网啦啦啦啦啦纺织女工火锅店第三课
开播时间:09月02日 10:30
即将开播,去预约

直播中,去观看