|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
8 `( ^. V7 @8 f课程内容:
0 l. @0 ?6 w3 ^. J* s 课时1 爬虫实战_课程介绍
: n; F# n+ M0 ]8 Y& i) ]2 W. ?' d- u 课时2 爬虫实战_ 认识爬虫
, D' e0 b* ^0 C. G9 ^ 课时3 requests库的安装与基本使用2
9 L" c7 w$ U$ t1 k. x 课时4 requests库中的User-Agent请求头7 ?1 O& z% Z7 E5 M+ W9 ?" { D
课时5 requests中的post请求
9 l$ U% p' S; { 课时6 了解cookie和session
! E8 E9 f1 G2 j a7 i9 w 课时7 requests中携带cookie信息
; J6 Z# F1 e8 U6 L/ K+ g$ u 课时8 requests库中的session方法6 n5 ?8 g" {0 l% {) j
课时9 Xpath安装及基本操作: K6 U, k4 x' U V, d/ M
课时10 Xpath数据解析方法( `* T/ X0 p$ q6 M- L d2 w
课时11 Xpath实战学习猿地登录2
9 L0 o/ u* Q8 ~3 |. r% d 课时12 爬虫实战Xpath抓取猿著文章39 D8 N& y# k: K2 ]" H
课时13 bs4的安装与三种使用方式 _; \7 {/ f; J' f9 n0 C! ~+ W+ h
课时14 bs4实战-学习猿地-猿圈
6 X3 U O" S8 O/ b4 P3 _3 Y 课时15 bs4-实战猿圈-代码优化3 F: ]( d1 |( e$ T9 }; S
课时16 re正则模块-介绍
& q+ q5 f# \3 \+ `3 d 课时17 re模块相关函数-match与search8 F3 F% @: ]( _7 p5 u3 a7 y
课时18 re模块相关函数-其它函数
) Q5 Q# f- C) m7 {3 c3 n 课时19 re模块-正则表达式的定义和规则-重点3
) @6 U9 q, ^+ B2 T+ ~ 课时20 re模块-正则实战-猿来如此
1 `' B( G8 v5 z" g: F7 B1 _
) [) H6 V# W b! e% }
|
|