|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
) a' J0 f5 e; ~% M& y# P课程内容:6 B' u+ F& G/ e& E! m
课时1 爬虫实战_课程介绍
, S: K- m! p5 C0 J 课时2 爬虫实战_ 认识爬虫
* }$ A+ ?0 ]5 O- N. `& e 课时3 requests库的安装与基本使用26 r: D8 u0 F% A/ d9 b
课时4 requests库中的User-Agent请求头+ p4 r2 L8 s9 g2 T
课时5 requests中的post请求
/ F: n& [/ I c9 n7 t" n$ x; r 课时6 了解cookie和session" t3 z- W* b- [- a) f/ D0 \9 z' Y' S7 O
课时7 requests中携带cookie信息
! e2 K5 K5 Y8 n0 Q+ z1 ?3 H) c' R 课时8 requests库中的session方法
: F& B* n6 C3 R) V- k 课时9 Xpath安装及基本操作% X; f8 c% C7 I
课时10 Xpath数据解析方法
4 P! D' h2 n) ` 课时11 Xpath实战学习猿地登录2$ A& q3 i+ _1 {$ m
课时12 爬虫实战Xpath抓取猿著文章3
) ]. {" j7 m6 a1 } 课时13 bs4的安装与三种使用方式
$ T1 H9 c4 a3 H" l. | 课时14 bs4实战-学习猿地-猿圈$ a0 F. m6 y, E! J
课时15 bs4-实战猿圈-代码优化9 N. Q6 o p* x8 C; l: [& h7 I6 ]' j
课时16 re正则模块-介绍
/ m0 Z1 D3 n b" ^; B* Y2 h 课时17 re模块相关函数-match与search V' w* E9 I8 v9 b* I
课时18 re模块相关函数-其它函数* J' g* b+ l8 S& N5 x& Z8 e3 q
课时19 re模块-正则表达式的定义和规则-重点3
$ ]: Z0 |3 c" M- q: Z) e 课时20 re模块-正则实战-猿来如此
! q+ S. X: @4 u9 Q- j4 C
, v1 @/ q' D8 }
|
|