|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
) s6 L% G" g) w) A2 k课程内容:
6 i; X ?7 |9 p8 o' t# P 课时1 爬虫实战_课程介绍2 u. Z; \! I& [% }
课时2 爬虫实战_ 认识爬虫
% f" X, Y3 s- _5 B 课时3 requests库的安装与基本使用2! j+ q$ N r+ ]9 X& Y0 n( v5 F% A
课时4 requests库中的User-Agent请求头
% {$ Y( O; H4 u1 c5 g 课时5 requests中的post请求6 \* h, A" V/ |2 O% V+ u- d6 E
课时6 了解cookie和session
( }4 Q, R% W+ _5 A2 R! [$ w/ w/ J 课时7 requests中携带cookie信息, ^. c, f3 [2 A3 i' S8 q! {- i& y
课时8 requests库中的session方法
6 E0 x: C% U* T2 X1 J+ W 课时9 Xpath安装及基本操作
0 S: I q8 Z/ @' T; O( F 课时10 Xpath数据解析方法
7 k1 B! P- }( c7 m+ [# @ 课时11 Xpath实战学习猿地登录24 G2 A) h: e# {2 q9 ]
课时12 爬虫实战Xpath抓取猿著文章3
! D) J( n P( B" m0 h/ ]0 K* f0 w 课时13 bs4的安装与三种使用方式
* n3 P" r9 A) ?2 d+ v4 v$ t 课时14 bs4实战-学习猿地-猿圈
' \& S; j# L% b4 @$ A6 s( v 课时15 bs4-实战猿圈-代码优化
. r o$ A" i) Z5 ` 课时16 re正则模块-介绍
3 a+ I8 z. i& e% g) Z 课时17 re模块相关函数-match与search
9 {. P: a( v q Q: {/ t4 t+ h" r+ c 课时18 re模块相关函数-其它函数
; v( S- ~1 z$ V 课时19 re模块-正则表达式的定义和规则-重点34 O4 _. J+ p; C% x" m* ?
课时20 re模块-正则实战-猿来如此6 n6 Q% p4 U& \0 G% V" l
8 z. ^* m9 j9 x% Y9 G
|
|