|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
# O9 D. _5 s$ j0 X5 H; e课程内容:
/ i! t( R4 v: I% b- t- | 课时1 爬虫实战_课程介绍1 B8 a3 h$ R( f; S# p! j
课时2 爬虫实战_ 认识爬虫- E+ S* d" m7 P9 B5 Z. n
课时3 requests库的安装与基本使用2/ q/ ~) [/ s& s: Y$ [
课时4 requests库中的User-Agent请求头5 Q$ K1 A$ W0 a
课时5 requests中的post请求
0 q$ W2 @* l" q8 u7 C# v 课时6 了解cookie和session
/ M# C1 P5 C+ q! w: Q 课时7 requests中携带cookie信息
, \% {6 ]3 O, U3 U5 J5 r4 ^ 课时8 requests库中的session方法" K0 B- K0 B% T' l
课时9 Xpath安装及基本操作
# M: C3 P- E2 l+ ]9 U+ I 课时10 Xpath数据解析方法3 l; ?( G$ U5 U' M
课时11 Xpath实战学习猿地登录24 s4 ?& j% t1 i; \( W* I7 z2 ~; {
课时12 爬虫实战Xpath抓取猿著文章3% P. p& k, [0 e
课时13 bs4的安装与三种使用方式
9 f0 o$ {1 H# U; ^# u' u# q( b6 W 课时14 bs4实战-学习猿地-猿圈
- }. X& I* t+ \6 y 课时15 bs4-实战猿圈-代码优化, y' A* p2 f" y3 h9 w6 q
课时16 re正则模块-介绍
& v- X3 `9 F, e! R. b* S 课时17 re模块相关函数-match与search
2 a5 @; ^% f5 G% A9 v" q 课时18 re模块相关函数-其它函数
* o( Y" H E) o- D: s3 V& { 课时19 re模块-正则表达式的定义和规则-重点32 n* o7 M. G L/ h. U( j
课时20 re模块-正则实战-猿来如此# f- R0 p0 ^" |3 i' n, \
8 T7 E$ A* t/ `4 F! g1 ^* F" ?
|
|