|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
, c4 l$ A$ _& o( l课程内容:
( u& @ o5 t' h0 ] @ 课时1 爬虫实战_课程介绍
; E3 E* s3 N: l$ [: r 课时2 爬虫实战_ 认识爬虫
: X9 `" Q% f; }9 b) G 课时3 requests库的安装与基本使用2
9 H p3 s# _! [. T K2 p 课时4 requests库中的User-Agent请求头
G" f! P$ i6 P* S7 F 课时5 requests中的post请求+ b$ i2 c( I: ?1 z8 K
课时6 了解cookie和session
' A) m! O, h D; S( ]& j7 u8 h% } 课时7 requests中携带cookie信息8 t7 a+ m# N# P
课时8 requests库中的session方法% c# ~8 U9 u+ H- d0 ~
课时9 Xpath安装及基本操作( j1 [0 e% C5 e" T
课时10 Xpath数据解析方法
' x# [) `( G O, u1 l3 @ S, r9 I& k 课时11 Xpath实战学习猿地登录2 y4 K* H+ m: z! q% D- U1 Y' _
课时12 爬虫实战Xpath抓取猿著文章3+ W3 b1 u" M8 B) N
课时13 bs4的安装与三种使用方式
7 Q" Z% i# T! E& ?6 j 课时14 bs4实战-学习猿地-猿圈- ?0 V1 t% `9 P8 O P# F& J
课时15 bs4-实战猿圈-代码优化) i" J# i: c! j
课时16 re正则模块-介绍
: A2 E" w$ j2 B: K. D7 J& C+ L$ T 课时17 re模块相关函数-match与search) M" @4 d7 r& f6 M0 k
课时18 re模块相关函数-其它函数
7 E: h. \- u$ b! L 课时19 re模块-正则表达式的定义和规则-重点3
9 J( f3 C% }2 v4 b3 I) U+ {# g 课时20 re模块-正则实战-猿来如此
l7 G6 v3 ^; ?% E' p
! O( m$ R7 ?7 y2 B, ~% n7 D( c I8 F
|
|