|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
9 h* W9 N( A( ~ w# G8 G1 B$ l* f. C课程内容:
: O: w7 f# Q8 U2 M* w y/ A# F$ W 课时1 爬虫实战_课程介绍
! O) Q8 q+ i; Y5 f8 l% I7 r 课时2 爬虫实战_ 认识爬虫
: D; \- m$ ^* F* N 课时3 requests库的安装与基本使用2
# q; ]/ n0 |. M 课时4 requests库中的User-Agent请求头
# } C, R- z \8 ?% W0 Y1 t 课时5 requests中的post请求
/ l& ~5 d+ \# n" O 课时6 了解cookie和session6 z7 z( D. {" a8 S) b
课时7 requests中携带cookie信息3 J1 A( P5 t: K
课时8 requests库中的session方法) Q( e: e% Z, O9 r: T3 e! `
课时9 Xpath安装及基本操作
- a2 H+ H" E( U* l. X6 y' P 课时10 Xpath数据解析方法9 N; _# G9 s6 C% [5 G+ m+ g
课时11 Xpath实战学习猿地登录24 ]4 P S/ i, k4 M1 O9 W8 v# q4 C, _0 F
课时12 爬虫实战Xpath抓取猿著文章3$ P2 E5 D4 S/ p! H L
课时13 bs4的安装与三种使用方式
# ]6 b; Q% W0 V9 @, D 课时14 bs4实战-学习猿地-猿圈
( ^/ _/ w _5 J- n3 e 课时15 bs4-实战猿圈-代码优化
7 K$ z+ z p8 G: y 课时16 re正则模块-介绍+ k6 T0 [' G" {- L$ p: n8 j
课时17 re模块相关函数-match与search: f: _ R% ^! K6 E( S
课时18 re模块相关函数-其它函数
7 a5 q$ m' ]$ k 课时19 re模块-正则表达式的定义和规则-重点3) X6 c# Q# V1 @
课时20 re模块-正则实战-猿来如此* o, c; z) ~) p2 E
& I3 C9 D. Y9 u W
|
|