基于python的web大数据爬取实战指南
图书信息
书名:基于python的web大数据爬取实战指南作者:夏换,杨秀璋,于小民
包装:平装
开本:16
全文字数:354000
出版社:科学出版社
出版时间:2019-03-01
图书简介
《基于Python的Web大数据爬取实战指南》主要研究基于Python的Web大数据爬取,采用Python语言实现。本书贯穿各种爬虫算法与案例进行讲解,内容涵盖基础知识和数据爬取两大部分。优秀部分“基础知识”包括Python基础、HTML基础、XML基础知识及DOM树结构,让读者对Python编程和Web环境有更深入的了解。第二部分“基于Python的数据爬取”详细介绍了Python网页爬虫的相关技术,包括正则表达式、Selenium、BeautifulSoup、Scrapy等,以及数据存储技术。本书实例丰富,从抓取在线百科、技术博客、新浪微博、生物医学网等各种信息入手,从基础知识到案例代码,由浅入深地将知识分享给读者。
推荐理由
本书内容丰富,实例详细,通过实战项目案例深入讲解了Python网络爬虫各种技术,是大数据从业者提升实战能力的必读指南。该书以Python为主线,紧跟大数据发展趋势,让读者更深入地了解Python编程和Web环境,通过多个实际项目的实例,让读者具备基本的数据爬取技能,更能够进一步深入学习和探索大数据领域。本书涵盖面广,内容深入,非常适合需要快速入门的初学者和期望深入了解数据爬取技术的高级工程师。