|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
' Z( J4 x* O" E5 l" i课程目录:
& M$ o) y: i5 z+ \) T& b; p 1.1- 火车头采集器的安装和功能简介: f b' [! q$ f$ S* a$ Z# C' c
1.2 - 火车头采集器的相关术语
, u6 {% k6 @& [; K& n 1.3 - 火车头采集器的学习建议& _) \% z; R/ S/ q3 J
2.1 - 如何添加需要采集的单条网址, _) ]3 s: g9 N0 ~, B4 {) ]/ j
2.2 - 如何添加批量和多页网址: {! l. P) j/ X6 X+ x, H7 [ {
2.3 - 如何导入txt网址到开始采集地址$ F9 G& e, O: t5 @7 I3 c
2.4 - 如何获取Rss地址中的网址作为起始网址- K/ R" K0 w+ N0 ?6 c0 K9 ?
2.5 - 如何自定义一些网址的格式来采集新的数据
' R* ?; |$ k2 C H! b 2.6 - 多级网址采集规则之从页面自动分析得到地址链接
( S j4 t$ L( x, T5 ]- q 2.7- 多级网址采集规则之手动填写链接地址规则
; _' x/ C- r& P1 S 2.8 - 多级网址采集规则之使用Xpath方式获取网址
6 M; ^, c- f6 q+ V9 \ 2.9 - 如何判断Http请求方式?是get还是post?
) r/ B6 n! m9 Q# u: |' y. X 2.10 - 多级网址采集规则之列表分页获取的方式( x% I! K) x6 L( j$ }3 J
2.11 - 多级网址采集规则之附加参数是什么意思?. V, a3 d9 L( x+ b$ i8 K0 z
3.1 - 提取数据方式有哪些
' a' G% ?; l5 b' W2 u 3.2 - 数据处理之内容替换0 i, x. y; O' s+ ~7 x& B
3.3 - 数据处理之Html标签过滤如何使用
2 q" o C! B: k 3.4 - 数据处理之字符截取. \* b1 `, ]. T" d1 l
3.5 - 数据处理之纯正则替换如何使用
p2 E/ O& g+ S1 l+ {5 X 3.6 - 数据处理之数据转换+ D& \1 U- b; V& H
3.7 - 数据处理之自动摘要
6 [) L+ A# x: F 3.8 - 数据处理之自动分词8 r3 n" B( {$ H( l0 L/ X* B
3.9 - 数据处理之字符编码和解码0 B" q+ `0 e8 {) j
3.10 - 数据处理之同义词替换' j- t* g! I/ ~! J, [* s; k' q, x
3.11 - 数据处理之提取文章中的第一张图片
; g1 B$ ]8 {5 `; { _- q 3.12 - 数据处理之空内容缺省值/ w2 g1 o# b: j% k0 U8 Z. z
3.13 - 数据处理之内容前后缀" y+ u+ T8 m7 A& v* V \ k( C
3.14 - 数据处理之随机插入7 K! \* |3 C* ~: S6 x
3.15- 数据处理之OCR图片识别
$ x6 p" Z* ~! H7 R 3.16 - 数据处理之对单网址进行补全
0 y0 I4 J1 I; i$ { 3.17 - 数据处理之文件下载的设置方法3 f4 t: W0 _' Q& o% g
3.18 - 数据处理之内容过滤相关设置
# w3 [7 T' P4 u; l 3.19 - 自定义固定格式的数据2 j$ N$ M. l3 P
3.20- 如何循环采集一些数据
0 s) H/ m3 W) W: ~ 3.21 - 如何采集网址中的数据
. v7 I b7 { J. z6 _0 a3 c 4.1 - Web在线发布到网址的设置方式# ~( q) q4 d4 c. ]
4.2 - 将采集到的数据保存为本地TXT文件形式
3 z1 O0 J' D+ t& m6 Z' @ 4.3 - 将采集到的数据保存为本地Word文件形式
6 U1 ~" \- `4 R. m3 L 4.4 - 将采集到的数据保存为本地Excel文件形式2 _" Y9 r; Q* C
4.5- 将采集到的数据保存为本地Html文件形式
8 i8 R* K7 V& k9 q6 i9 O- t 4.6 - 将采集到的数据保存为本地Csv文件形式
/ l4 z0 Y4 F: r* e 4.7 - 将采集到的数据导入到自定义数据库
: y' p) N! \9 q- s' @# u g 4.8 - 发布数据完成之后可以对数据进行哪些操作& i/ g6 p! _& [
4.9 - 如何控制每次发布的数据的条数+ ? e1 T% Y) u
5.1 - 任务运行时线程设置的讲解
' W! V% R5 F" o0 u/ O' T 5.2 - 文件下载设置的相关注意事项( y6 T+ m" A K; g
5.3 - FTP同步文件上传如何设置& ~3 n) z; N( a" }. z1 a
5.4 - 如何给采集到的图片加上水印
3 ?1 C: r" D6 |! N
, b( u* {& x! ]) ]
|
|