|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。- l) ]9 t9 M% I1 k+ c
课程内容:
1 r# Z' Z2 _0 o" m0 H 课时1 爬虫实战_课程介绍
6 Y& M, t, T, A2 h" z) ^9 Z 课时2 爬虫实战_ 认识爬虫
4 E- c( b3 O1 H 课时3 requests库的安装与基本使用24 N4 q4 M+ j2 Z) V
课时4 requests库中的User-Agent请求头! J- ~5 {5 e# v2 ^ {' Z7 ?
课时5 requests中的post请求4 `% F" }6 P1 [1 s# w1 e
课时6 了解cookie和session
3 e* `- j/ Y% H" E& t9 M 课时7 requests中携带cookie信息
* S' \+ I3 ?8 }( i. B7 K 课时8 requests库中的session方法' b' `' ?2 \2 e7 y& v1 O* A
课时9 Xpath安装及基本操作2 O( M& a1 ?5 Y! M/ a6 y6 v/ p, X
课时10 Xpath数据解析方法
; L( S# D3 p& ~$ O& ~ 课时11 Xpath实战学习猿地登录2
' C3 [6 o" ~% _! N 课时12 爬虫实战Xpath抓取猿著文章38 p; e9 \8 T; }) I4 T# P
课时13 bs4的安装与三种使用方式' x+ F: _# _; {. D8 P
课时14 bs4实战-学习猿地-猿圈
* {4 I' t/ b. `; @# o2 f 课时15 bs4-实战猿圈-代码优化2 {2 o! Y1 V$ k% E
课时16 re正则模块-介绍
0 T0 q# H& l& w( t/ {% I 课时17 re模块相关函数-match与search
" Z$ \6 X J& r, e: K4 ]2 _ 课时18 re模块相关函数-其它函数
9 x6 s' G1 x: c+ Q- { 课时19 re模块-正则表达式的定义和规则-重点3, I* y# n, `) n# ~) H k
课时20 re模块-正则实战-猿来如此
& W& f/ d" r% {" X% ^: I! J$ o. e 5 R" `3 k7 d9 e1 ~, l
|
|