|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
+ R) R: U p9 H( M6 m课程内容:
) j. x) G; q' V, r6 g |# I5 t 课时1 爬虫实战_课程介绍) h. P" N+ ^3 V2 |
课时2 爬虫实战_ 认识爬虫
% K2 A0 l! Z/ Q& V5 D 课时3 requests库的安装与基本使用2& N( x" B/ A1 W; k+ r0 S
课时4 requests库中的User-Agent请求头$ D/ V8 q9 M( v4 L, G
课时5 requests中的post请求
- U2 N6 i% `, r9 @6 f$ D 课时6 了解cookie和session: r. y7 B8 N; e, L; B, q. c3 _
课时7 requests中携带cookie信息8 z, B' Z4 d* Z& ]! N* L7 ^
课时8 requests库中的session方法
8 [2 R$ z: e- e1 `: ]# f" \, _# u$ r: I 课时9 Xpath安装及基本操作! N3 \# m1 a. b( D5 F! C$ z
课时10 Xpath数据解析方法
2 C$ }3 l" ]/ D& c6 w: q 课时11 Xpath实战学习猿地登录2
* F7 s+ b" _9 ?- V1 f& |5 D7 f* _ 课时12 爬虫实战Xpath抓取猿著文章3
5 D) Z: Q, n/ s: t @ 课时13 bs4的安装与三种使用方式
8 L8 Q- n! `9 b: j& @ 课时14 bs4实战-学习猿地-猿圈
/ k7 U9 j: h; D. _0 j4 \. e 课时15 bs4-实战猿圈-代码优化# c% x) G9 j! P& e. F
课时16 re正则模块-介绍8 o+ e9 n! d# a* ]0 @- t' W* `! Z
课时17 re模块相关函数-match与search
/ Z3 C0 J5 N5 f. ^3 M9 Q8 v 课时18 re模块相关函数-其它函数$ P$ {! N( X7 J. k
课时19 re模块-正则表达式的定义和规则-重点3
~. D& s+ j N& Q) u5 u& {, {: u 课时20 re模块-正则实战-猿来如此3 ^; L5 t V0 s7 \+ S
( i: `8 C; g0 i! d8 E6 `( f
|
|