|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
' I9 d! a$ b& J, O) H9 S, c课程内容:
! k* q( N0 `" {# T6 {1 M 课时1 爬虫实战_课程介绍. n- p+ c% ?' y1 B- ~
课时2 爬虫实战_ 认识爬虫4 r! I# K( D1 J% C
课时3 requests库的安装与基本使用2& d+ P7 Z6 ~$ U8 w2 q
课时4 requests库中的User-Agent请求头
8 y3 T9 h8 R2 I R# S$ X7 h% R( N. g 课时5 requests中的post请求# D, T4 t) ^, a7 l3 }
课时6 了解cookie和session
; u% g# u8 I4 e3 ~* c$ k y 课时7 requests中携带cookie信息. u& _6 x, ?, C- k
课时8 requests库中的session方法) ]& P: b/ T; N* A" _
课时9 Xpath安装及基本操作% v/ f$ \) z- t! y9 v% J4 U! a2 X
课时10 Xpath数据解析方法9 f. s$ ^8 j+ e: R3 g8 x8 |
课时11 Xpath实战学习猿地登录2; `( Z! R, ?/ n( y$ |
课时12 爬虫实战Xpath抓取猿著文章3 A, @# ~; b0 v8 m% p7 F, q0 V
课时13 bs4的安装与三种使用方式
! \+ X# A7 _+ p. Y: I) }$ v( `) a) C 课时14 bs4实战-学习猿地-猿圈
. o0 t6 {0 u9 ~' z6 I1 e+ k 课时15 bs4-实战猿圈-代码优化, h+ c% Q$ ]* B! \9 o
课时16 re正则模块-介绍
, i% Q* u! I$ c' Y7 `8 E1 j 课时17 re模块相关函数-match与search
1 h' G9 O s5 x/ K+ W1 s Q 课时18 re模块相关函数-其它函数
1 P6 f3 x* D/ G8 t& {* n8 Q 课时19 re模块-正则表达式的定义和规则-重点3
0 N1 d' r0 I0 E. T0 x$ U, D ?3 V 课时20 re模块-正则实战-猿来如此3 l5 V8 q( t1 f# [7 l
8 ~$ x# C) p& {9 H
|
|