|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。, V* w$ ]7 I! `. J( Z0 ^
课程目录:
% ? M: p" N2 j( Q/ a' c 1.1- 火车头采集器的安装和功能简介) `1 r6 v u$ h3 J
1.2 - 火车头采集器的相关术语/ J- L* @ u# b: {, ^
1.3 - 火车头采集器的学习建议
* L2 F8 D5 B8 Y$ t/ r 2.1 - 如何添加需要采集的单条网址* U% K$ G1 I5 }$ B4 }0 @0 a( ?" {
2.2 - 如何添加批量和多页网址: b6 N6 q/ Z' v8 V3 ^
2.3 - 如何导入txt网址到开始采集地址
, |# B5 ?7 |* `8 k) d 2.4 - 如何获取Rss地址中的网址作为起始网址
E' R, P- r: j1 w* T$ d 2.5 - 如何自定义一些网址的格式来采集新的数据
$ Y3 G0 O+ E1 U8 E& ] 2.6 - 多级网址采集规则之从页面自动分析得到地址链接
+ J7 N4 c+ F! a9 w, s, q6 m 2.7- 多级网址采集规则之手动填写链接地址规则: ~/ M, m; p; G; O4 T7 [. c8 q
2.8 - 多级网址采集规则之使用Xpath方式获取网址
- n& p" i# h2 L$ [' D& } 2.9 - 如何判断Http请求方式?是get还是post?
$ i7 B$ \9 v3 h: ^# L 2.10 - 多级网址采集规则之列表分页获取的方式
- _4 j, _$ F' \7 e 2.11 - 多级网址采集规则之附加参数是什么意思?
& S0 ?. {6 i/ K" I/ b h 3.1 - 提取数据方式有哪些" m) w* }* }1 |8 J
3.2 - 数据处理之内容替换
+ j' ?% M* E5 j8 l3 N, P 3.3 - 数据处理之Html标签过滤如何使用
, o* l0 r% E# ~% y 3.4 - 数据处理之字符截取% M/ v. ~+ g& C
3.5 - 数据处理之纯正则替换如何使用
. c& G. [; ~0 s) W/ ~: m+ k 3.6 - 数据处理之数据转换
% E6 g# m0 K+ t. w6 A 3.7 - 数据处理之自动摘要
! i+ A4 C6 i! F6 J& O 3.8 - 数据处理之自动分词9 _# I) }/ ]2 F- ^7 d" |
3.9 - 数据处理之字符编码和解码" E% U( }( s) Z
3.10 - 数据处理之同义词替换
. L- Y( v* D6 B- Z 3.11 - 数据处理之提取文章中的第一张图片# a( N# ?) t1 s) z; i, f/ g8 G; c
3.12 - 数据处理之空内容缺省值# }% Z/ [/ K0 x4 F' i7 N
3.13 - 数据处理之内容前后缀
) I9 ]# h- g9 i& f 3.14 - 数据处理之随机插入' L) p7 I8 P9 w% \5 J+ c* X5 E
3.15- 数据处理之OCR图片识别
) [/ }# t1 w) J7 V' k 3.16 - 数据处理之对单网址进行补全
" b7 I9 ?% {' L/ N0 I) v% M 3.17 - 数据处理之文件下载的设置方法, `( }2 B0 l/ N% E4 D0 y, D6 t0 @
3.18 - 数据处理之内容过滤相关设置8 _/ A8 J# C/ g t; z7 c. ]2 k
3.19 - 自定义固定格式的数据
5 N& \9 O" [3 y$ \$ @ 3.20- 如何循环采集一些数据8 q: [% V3 O2 j; Q
3.21 - 如何采集网址中的数据
) X' \2 c! e$ P# ]: N# }& z 4.1 - Web在线发布到网址的设置方式
* Y3 }. a9 m( \2 [' F# l6 ^ 4.2 - 将采集到的数据保存为本地TXT文件形式
- }4 {" l8 {% k5 Z' i; l 4.3 - 将采集到的数据保存为本地Word文件形式
' ]/ `* M5 `3 e3 @5 Z K 4.4 - 将采集到的数据保存为本地Excel文件形式7 U/ p; X" v% `& i" q
4.5- 将采集到的数据保存为本地Html文件形式- L6 y& B8 w/ J2 ]) q, J. T
4.6 - 将采集到的数据保存为本地Csv文件形式
" e8 p/ q H9 w. T" ^4 K 4.7 - 将采集到的数据导入到自定义数据库
. N4 t8 ^- G W 4.8 - 发布数据完成之后可以对数据进行哪些操作
, j+ I( F# U! P$ U 4.9 - 如何控制每次发布的数据的条数; g$ H- _) [. Y9 D
5.1 - 任务运行时线程设置的讲解/ M- ]' M! \8 z8 {
5.2 - 文件下载设置的相关注意事项1 d# {' u, f. z
5.3 - FTP同步文件上传如何设置( l9 J) }5 M9 `1 l
5.4 - 如何给采集到的图片加上水印8 ~8 t2 r4 K5 E8 Y& }$ {* F
% S w- a Z% H" n3 y$ F
|
|