本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、Beautiful Soup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,后介绍了pyspider框架、Scrapy框架和分布式爬虫。& K/ L. ^% ^; T7 h3 R6 G
$ C! b& A( a# e" M! Y y! S% N 9 O/ |5 q! D r1 x0 f 6 t E, d0 u, O4 U
$ n- H# ?5 g: m- l3 a