|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
+ J) m# V1 A c/ {8 p9 u, m课程内容:% A# @1 r. x4 G% K( a3 b' u" L7 [# L
课时1 爬虫实战_课程介绍
7 |0 z, k1 |' t0 i& k/ V5 W 课时2 爬虫实战_ 认识爬虫" {" W& J4 c0 Q
课时3 requests库的安装与基本使用2# Y8 E) d' p& w
课时4 requests库中的User-Agent请求头
O& a# h1 n2 T+ f2 W% v 课时5 requests中的post请求, E' S2 r3 n# e9 |/ A9 R
课时6 了解cookie和session* S- Z3 A1 E/ G; M* Y6 Z$ N# R' K
课时7 requests中携带cookie信息
. ?) w# F- U6 i! k! g 课时8 requests库中的session方法: i. L" j! d# q1 Y& \- l# |
课时9 Xpath安装及基本操作. q0 J% q0 g7 d- B7 M, D# s: D
课时10 Xpath数据解析方法
& ~* F, A7 H1 J# ] 课时11 Xpath实战学习猿地登录2
! T- c; S0 U' ]8 d) u 课时12 爬虫实战Xpath抓取猿著文章3
: ~4 u9 t* L" O" y# v S9 J9 _ 课时13 bs4的安装与三种使用方式7 M6 f2 v# }* Y- o7 R. C5 j& x
课时14 bs4实战-学习猿地-猿圈
" k4 C) R1 g$ ~3 X: a* z% v6 a+ Y, _ 课时15 bs4-实战猿圈-代码优化- U, U2 v" w! L" G3 V
课时16 re正则模块-介绍 k6 W1 s; y0 W& Z
课时17 re模块相关函数-match与search
7 o! \9 f, T1 R 课时18 re模块相关函数-其它函数5 ?+ A; ]# h9 J3 q0 B8 u
课时19 re模块-正则表达式的定义和规则-重点3) d* f' H3 G( x1 Z. q8 d
课时20 re模块-正则实战-猿来如此
2 ?( D) |: N4 F) R- _
% R' B% B; L# O7 F4 B, i; ]* W
|
|