本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、Beautiful Soup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,后介绍了pyspider框架、Scrapy框架和分布式爬虫。3 ~( F/ v: r9 m; S! k
( E0 ?' K1 ^: C# l + n6 ^: {0 I, _ k. n- D
5 V0 v6 t. |" p, v # K6 D- K1 E6 g' c