|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
7 M- p7 P+ H4 B( B课程内容:
* y6 A _9 I; \1 E. V, u+ y 课时1 爬虫实战_课程介绍
0 e' W4 [* L6 `% I, W$ F: M 课时2 爬虫实战_ 认识爬虫
) v$ D X6 p P 课时3 requests库的安装与基本使用2; r( m* ]+ @, D6 f
课时4 requests库中的User-Agent请求头. l) c2 p+ X; a6 }" N$ Q
课时5 requests中的post请求
3 \" c5 z% U) U- S- z. N 课时6 了解cookie和session( r! L, \! c+ Q- N! Q
课时7 requests中携带cookie信息
$ s' O, H4 d) y1 U 课时8 requests库中的session方法& q# L" ]9 q3 T) z
课时9 Xpath安装及基本操作. t C1 o" U- C; j0 p* a
课时10 Xpath数据解析方法
9 ~ ?* b3 D3 P I 课时11 Xpath实战学习猿地登录27 ?* j+ a/ Q0 L. e# e' T2 ?
课时12 爬虫实战Xpath抓取猿著文章3
4 U7 u% M( U' c) R 课时13 bs4的安装与三种使用方式
8 C& j2 J5 Q% i, ^- d- v t 课时14 bs4实战-学习猿地-猿圈: u6 N6 l! \+ p& d1 Q p
课时15 bs4-实战猿圈-代码优化; K! n p5 a9 g& \8 M" g
课时16 re正则模块-介绍' D9 S3 Y0 ]" {: R1 t( z* j
课时17 re模块相关函数-match与search
3 q2 Z3 D6 c/ z 课时18 re模块相关函数-其它函数. E% W& V E4 N4 ?4 f: t
课时19 re模块-正则表达式的定义和规则-重点3
0 A) H0 ]+ g9 ?: K# a: l! P K 课时20 re模块-正则实战-猿来如此: H$ ?( @! m; ?
2 @ H/ P* T+ @6 e
|
|