正版Python 3网络爬虫开发实战 Scrapy数据分析处理手册 数据抓取指南 python编程
图书信息
书名:正版Python 3网络爬虫开发实战 Scrapy数据分析处理手册 数据抓取指南 python编程作者:崔庆才
包装:平装
页数:608页
出版社:人民邮电出版社
出版时间:2018-4
图书简介
本书详细介绍了如何利用Python 3开发网络爬虫。首先介绍了环境配置和基础知识,然后讨论了常见的爬虫库,如urllib、requests、Beautiful Soup、XPath、pyquery等。接着通过多个案例,介绍了不同场景下如何实现数据爬取。例如,Ajax数据爬取、动态网站爬取等。最后介绍了pyspider框架、Scrapy框架和分布式爬虫。本书的章节完整,涵盖了数据采集、数据存储、动态网站爬取、App爬取、验证码破解、模拟登录、代理使用等方面的知识以及爬虫框架、分布式爬取的使用。内容详尽,贴近实战。本书适合Python程序员阅读,尤其适合想要学习爬虫或提高爬虫技术的读者。
推荐理由
本书是一本Python网络爬虫开发的实战手册,内容详尽。阐述了数据采集的基本知识、常用爬虫库,如urllib、requests等,然后介绍了如何进行动态网站爬取、App爬取、验证码破解、模拟登录和代理使用等方面的知识。书中还涉及到爬虫框架和分布式爬虫。作者丰富的实战经验,可以帮助读者快速提高爬虫技术,适合Python程序员和想要学习爬虫的读者。