-
作者:
作者
-
出版社:
清华大学出版社
-
ISBN:
9787302640516
-
出版时间:
2023-09
-
版次:
1
-
装帧:
平装
-
开本:
16
-
页数:
488页
-
字数:
874千字
-
出版时间:
2023-09
-
版次:
1
-
装帧:
平装
-
开本:
16
-
页数:
488页
-
字数:
874千字
售价
¥
72.60
6.1折
定价
¥119.00
品相
全新品相描述
上书时间2024-04-27
卖家超过10天未登录
手机购买
微信扫码访问
-
-
商品描述:
-
主编:
“私房菜谱”
python爬虫基础知识
python网络库
python解析库
python数据存储
python异步数据抓取
python h爬虫
python移动app数据抓取
python多线程爬虫
python可见即可“爬”
python crapy实战
python识别验证码
python项目实战
“实战项目”
抓取小说目录与正文
抓取豆瓣网图书榜单
抓取房屋租赁信息
抓取豆瓣网音乐排行榜
抓取百度图片搜索中的图片
检测滑动验证码
可视化爬虫抓取和分析网图书
目录:
篇基础知识
章开发环境配置
1.1搭建python编程环境
1.1.1获取python安装包
1.1.2安装windows版的python开发包
1.1.3安装macos版的python开发包
1.1.4安装linux版的python开发包
1.2安装anacondapython开发环境
1.3消除pythonrepl中的错误和警告
1.4安装pycharm
1.5配置pycharm
1.6小结
第2章爬虫基础
2.l基础
2.1.1uri和url
2.1.2超文本
2.1.3与s
2.1.4的请求过程
……
内容简介:
本书从实战角度系统论述了python 爬虫技术的核心知识,并通过大量的真实项目帮助读者深入掌握python 爬虫技术及其实现。本书提供了大量实战案例,演绎采用各种技术编写python 爬虫的方式。读者可以任意组合使用这些技术,完成非常复杂的爬虫应用。本书共20 章,分为五篇。篇:基础知识(~2 章),主要包括python 编程环境的搭建、ide 的安装和使用、 的基础知识、网页基础(html、c、javacript)、爬虫的基本、eion、cookie。第二篇:网络库(第3~5 章),主要包括网络库urllib、urllib3 和requet 的核心使用方法,例如,发送 请求、处理超时、设置 请求头、处理中文字符、搭建和使用代理、解析、robot 协议等。第三篇:解析库(第6~9 章),主要包括3 个常用解析库(lxml、beautiful oup 和pyquery)的使用方法,同时介绍了多种用于分析html 代码的技术,例如,正则表达式、xpath、c 选择器、方法选择器等。第四篇:数据存储(0~11 章),主要包括python 中数据存储的解决方案,如文件存储和qlite 数据库。第五篇:爬虫应用(2~20 章),主要包括python 爬虫的一些技术,如抓取异步数据、elenium、h、抓取移动app 数据、appium、多线程爬虫、爬虫框架crapy、通过opencv 技术识别验证码;后给出一个综合的实战案例,该案例综合了python 爬虫、数据存储、pyqt、多线程、数据可视化、web 等多种技术实现一个可视化爬虫。
作者简介:
李宁 华为hde(huawei developer expert),unitymarvel创始人,开放原子会银牌讲师,51cto学堂讲师,it书作者。从事软件研究和开发超过20年,长期从事编译器、人工智能、python、javacript、java及跨台技术的研究和开发工作,曾出版超过40本it图书。
孔网啦啦啦啦啦纺织女工火锅店第三课
开播时间:09月02日 10:30
即将开播,去预约
直播中,去观看