|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
% Y2 D' |+ }% Z8 q9 k3 Q: P课程内容:
2 E: r+ X4 j6 o* I7 g5 ] 课时1 爬虫实战_课程介绍' G7 J1 e( x6 Q# C
课时2 爬虫实战_ 认识爬虫& K: V$ v! _# Y4 v; |! k. ?
课时3 requests库的安装与基本使用2
9 {# q+ R8 u4 q5 n a% I 课时4 requests库中的User-Agent请求头
, o& b# y" P* b# \ 课时5 requests中的post请求
: o g$ @6 o/ I& C5 L. b( } 课时6 了解cookie和session
& l+ h5 i( D' O2 [ 课时7 requests中携带cookie信息
" _. t+ f5 x" _2 @5 |2 U 课时8 requests库中的session方法
+ u9 s$ b6 V" U 课时9 Xpath安装及基本操作 e. a+ N; f/ e# T3 ~) L) N3 u
课时10 Xpath数据解析方法
- I' z( s6 S8 P2 K) J, F9 Y; o 课时11 Xpath实战学习猿地登录2
4 X# w1 z' q* z/ Y- L7 h 课时12 爬虫实战Xpath抓取猿著文章3
/ B* k0 J5 O* n+ E6 ? 课时13 bs4的安装与三种使用方式
, @3 s. I2 V$ _0 F 课时14 bs4实战-学习猿地-猿圈
- L; Y! E' z8 ^$ F: j1 o 课时15 bs4-实战猿圈-代码优化* B, u2 _; w9 s% r
课时16 re正则模块-介绍
- b h8 f# c4 F, ~$ o 课时17 re模块相关函数-match与search! K' g& d- J' N- s0 l0 s4 V
课时18 re模块相关函数-其它函数
' B& c/ T# M2 W 课时19 re模块-正则表达式的定义和规则-重点37 k1 I/ }9 P) G! G
课时20 re模块-正则实战-猿来如此
# v8 \% `/ D" X8 t0 F 9 u- q! }6 x8 |0 u4 W% y) ]
|
|