|
|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
8 q0 H W( w" I7 X4 z课程目录:
2 B3 ^: d- |/ @; T J 1.1- 火车头采集器的安装和功能简介
% {9 ?; ~0 s* G& @- y 1.2 - 火车头采集器的相关术语
+ X- ^+ J1 i8 D 1.3 - 火车头采集器的学习建议1 V' ^. u |1 I) S
2.1 - 如何添加需要采集的单条网址* v" a% M9 Y, S2 {; I. m
2.2 - 如何添加批量和多页网址
5 Y( e) L0 v# { 2.3 - 如何导入txt网址到开始采集地址
; M1 W2 @8 {" O+ N2 e% x 2.4 - 如何获取Rss地址中的网址作为起始网址/ K+ n! _! `5 Z& H E4 J9 ? C8 P
2.5 - 如何自定义一些网址的格式来采集新的数据/ L6 t, u/ t6 ] p8 ~
2.6 - 多级网址采集规则之从页面自动分析得到地址链接9 d* p) C9 N) m" {) A4 s7 X, ]
2.7- 多级网址采集规则之手动填写链接地址规则& x+ k: @% h2 B5 `; t
2.8 - 多级网址采集规则之使用Xpath方式获取网址3 f$ c/ h7 T; H5 ^7 V5 s
2.9 - 如何判断Http请求方式?是get还是post?3 V: e$ _2 A- D4 q* A
2.10 - 多级网址采集规则之列表分页获取的方式
$ [ }4 M% ?0 I 2.11 - 多级网址采集规则之附加参数是什么意思?% u( a; m, h9 e( H r
3.1 - 提取数据方式有哪些
! l# ~( f6 e8 E; M" N) B 3.2 - 数据处理之内容替换1 f$ H6 i5 f4 E* S* L4 i4 T* F
3.3 - 数据处理之Html标签过滤如何使用
$ W1 Q9 l+ z, N6 i/ k" e( E 3.4 - 数据处理之字符截取
% Y: @/ @) |& I; |4 U& [ 3.5 - 数据处理之纯正则替换如何使用. e$ a, f$ S! T
3.6 - 数据处理之数据转换
# K* c8 f) U+ L/ i! Y' ~ 3.7 - 数据处理之自动摘要0 V0 W" M! V/ ?4 @
3.8 - 数据处理之自动分词0 T3 [: J: w1 [ ?1 W2 f
3.9 - 数据处理之字符编码和解码
3 m: l% ^* B% h5 y$ M0 j6 X 3.10 - 数据处理之同义词替换
$ k; T" F/ `; G6 M" T 3.11 - 数据处理之提取文章中的第一张图片+ x0 A6 g# v! C4 v, x2 N2 s2 g0 A
3.12 - 数据处理之空内容缺省值) {0 h" Q% W4 E& _: l
3.13 - 数据处理之内容前后缀
N, G6 D/ s( J! R 3.14 - 数据处理之随机插入! c x! i" E0 L/ Z1 E
3.15- 数据处理之OCR图片识别0 x. W+ d' Y, [9 g9 o& n
3.16 - 数据处理之对单网址进行补全9 E+ }) Q* `0 X8 h2 E
3.17 - 数据处理之文件下载的设置方法& R3 C" U8 u9 G$ K) Q7 \
3.18 - 数据处理之内容过滤相关设置
! V- C1 B. B& S/ n" [# r 3.19 - 自定义固定格式的数据% e9 K. R; J! o F p2 C
3.20- 如何循环采集一些数据
! a! ]6 X; E; X1 X 3.21 - 如何采集网址中的数据; U; Z6 @2 x* R" C; L
4.1 - Web在线发布到网址的设置方式/ }& u( N/ A; A0 g" ^$ n. O
4.2 - 将采集到的数据保存为本地TXT文件形式
" h U a/ n! _2 k* e% J 4.3 - 将采集到的数据保存为本地Word文件形式
0 E; t- N7 y5 [/ o B7 ? 4.4 - 将采集到的数据保存为本地Excel文件形式
$ E6 s" k5 L2 m# w; ~0 J 4.5- 将采集到的数据保存为本地Html文件形式; z" \) _1 Q" E" \* d
4.6 - 将采集到的数据保存为本地Csv文件形式. ]8 u1 Z( O, y$ }1 t8 s0 o/ |
4.7 - 将采集到的数据导入到自定义数据库' d% j+ K2 d) s+ w/ f4 R
4.8 - 发布数据完成之后可以对数据进行哪些操作- h( G. \) [1 l) x$ ?0 ~
4.9 - 如何控制每次发布的数据的条数$ k3 X+ v1 U& Q
5.1 - 任务运行时线程设置的讲解/ S1 d1 M1 j6 x7 `; y# S
5.2 - 文件下载设置的相关注意事项
) y5 H9 a* U- x$ _ 5.3 - FTP同步文件上传如何设置+ a7 {" t. R; X2 r9 @' M
5.4 - 如何给采集到的图片加上水印
0 Z( N( Q" Z% @; N/ W 1 V p$ L( O: A n
|
|