|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
* L- r4 U2 M, `课程内容:5 ? D- {5 P2 |+ M8 z3 w8 M
课时1 爬虫实战_课程介绍. x% C8 ~( c+ Q5 P( w, C
课时2 爬虫实战_ 认识爬虫
, R5 }, `( ]% v; ~8 j 课时3 requests库的安装与基本使用2' x& y$ O# ^' B- m! C+ W6 ?
课时4 requests库中的User-Agent请求头
4 ?& c Y6 _% r 课时5 requests中的post请求
6 [, N- R( u. `$ K3 z 课时6 了解cookie和session
1 l- ?; }9 C1 c+ l' s# N% z/ L 课时7 requests中携带cookie信息
; n/ N8 v* r) }7 N 课时8 requests库中的session方法
; c" [: O# G' b! O# j 课时9 Xpath安装及基本操作; I8 t9 {+ t8 }5 {9 o' \5 W
课时10 Xpath数据解析方法5 a. F- z& m: C: N B& d4 b
课时11 Xpath实战学习猿地登录2
6 r& k# N* P. R0 r8 e" `* a9 p ` 课时12 爬虫实战Xpath抓取猿著文章3
; k4 a8 W- @+ H5 R* B8 d 课时13 bs4的安装与三种使用方式" S0 ]+ z( N7 F/ |; y. L
课时14 bs4实战-学习猿地-猿圈
, x$ I) A6 f' C V' p 课时15 bs4-实战猿圈-代码优化2 Y6 Z# E% h/ m4 P d. S
课时16 re正则模块-介绍
7 L" a6 x6 G) N5 ~' W3 y. v 课时17 re模块相关函数-match与search
: A1 m5 \$ c6 Y/ K8 u 课时18 re模块相关函数-其它函数7 M7 R2 y1 c6 ]1 ?( u
课时19 re模块-正则表达式的定义和规则-重点3
! A/ {% a; M5 F' B& z4 `* R: R' p 课时20 re模块-正则实战-猿来如此, f: U2 r0 H. @) B% n+ L9 |6 z
8 `4 A8 i6 S3 i" D
|
|