|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。' ^# n7 Z- w D0 e' L' w! F1 \
课程内容:9 ^% o r" x9 L2 B; u
课时1 爬虫实战_课程介绍
. ?; x( K7 ?4 |4 Z 课时2 爬虫实战_ 认识爬虫
0 [$ e2 m5 e) w; U$ G5 k 课时3 requests库的安装与基本使用2) ]) W0 k. i% T. [
课时4 requests库中的User-Agent请求头
4 B' B: a: o2 ^: T& r, D 课时5 requests中的post请求2 B* I4 G1 e) x# d2 V& ~
课时6 了解cookie和session- [; l1 p! E7 C0 ~4 I
课时7 requests中携带cookie信息
$ Y, K2 h @2 ?% K, l) f* @ 课时8 requests库中的session方法
3 o# [0 t. j; |* E- b$ x: R' j- V% v 课时9 Xpath安装及基本操作7 c. J1 ^6 p0 E2 p
课时10 Xpath数据解析方法
_' V6 C! F- p% ^$ G 课时11 Xpath实战学习猿地登录29 ^# M* W2 S) R1 z2 A
课时12 爬虫实战Xpath抓取猿著文章30 ?0 v- f' `9 C6 r' l3 n Q
课时13 bs4的安装与三种使用方式" M: }" Y1 |, | Q! ^+ u5 K
课时14 bs4实战-学习猿地-猿圈
8 t: B+ `5 w2 N2 M6 Y 课时15 bs4-实战猿圈-代码优化
; l! g# M3 g) F6 C; X0 X 课时16 re正则模块-介绍" c; k" u* G8 B8 ^
课时17 re模块相关函数-match与search5 O2 I2 v. S+ k
课时18 re模块相关函数-其它函数
# [5 X4 M; \ B/ ^( Q( F8 A* C 课时19 re模块-正则表达式的定义和规则-重点3+ z) R4 S+ {7 [
课时20 re模块-正则实战-猿来如此
% l7 t" Y' G. ~ - k: |+ O- j8 o( Y
|
|