|
|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
A+ N) Q9 X% \7 v4 F* W课程目录:% X! H3 V- n2 M0 T
1.1- 火车头采集器的安装和功能简介4 c, f( p0 U6 H3 k
1.2 - 火车头采集器的相关术语& Q! G+ o/ U8 y1 T: j0 Y; Z' p# ~
1.3 - 火车头采集器的学习建议; v( @8 Y G) c2 Q- K# g
2.1 - 如何添加需要采集的单条网址; w4 V$ T" o& x- ?. |! P8 _
2.2 - 如何添加批量和多页网址- k- v* ]- ], X2 i4 H; v; X
2.3 - 如何导入txt网址到开始采集地址1 _3 R: u: o7 k( e% Y
2.4 - 如何获取Rss地址中的网址作为起始网址
* A# ]+ b. ]7 H+ D9 I 2.5 - 如何自定义一些网址的格式来采集新的数据
6 f; U3 J" `, }& A 2.6 - 多级网址采集规则之从页面自动分析得到地址链接3 g% ]: \5 K: d' F6 Q. B2 R8 a
2.7- 多级网址采集规则之手动填写链接地址规则
0 }5 z( v9 G7 v4 \' P0 B 2.8 - 多级网址采集规则之使用Xpath方式获取网址9 T' N+ a0 @& K# r0 q
2.9 - 如何判断Http请求方式?是get还是post?" T/ x6 s( w* V' a. @! W8 ~) R! c
2.10 - 多级网址采集规则之列表分页获取的方式/ z3 R- j) g" v
2.11 - 多级网址采集规则之附加参数是什么意思?/ G4 U" n! f( w0 {
3.1 - 提取数据方式有哪些# w" J! Q5 B" T2 Z
3.2 - 数据处理之内容替换2 r* Y7 v6 v$ X" G+ r
3.3 - 数据处理之Html标签过滤如何使用; w4 w3 k2 u" _4 Z% m1 ~
3.4 - 数据处理之字符截取. y. v/ h% w# G8 a
3.5 - 数据处理之纯正则替换如何使用" I" r$ m' l# m* K W! L; I* T
3.6 - 数据处理之数据转换
3 v' \3 `# `6 V 3.7 - 数据处理之自动摘要
! C+ @6 g# C8 k# C. h( [ 3.8 - 数据处理之自动分词
$ F0 M R4 P; J/ u6 {% K 3.9 - 数据处理之字符编码和解码9 E8 P2 Y+ I2 _" ^9 m1 [
3.10 - 数据处理之同义词替换
& P; _ E# Z5 n0 |- s3 F 3.11 - 数据处理之提取文章中的第一张图片, ^9 p( Z" J$ V2 ?, x
3.12 - 数据处理之空内容缺省值. Z+ H( J, e, @, n4 V- ~
3.13 - 数据处理之内容前后缀8 U0 @* ?9 r- Z4 c& v" b. Y/ _
3.14 - 数据处理之随机插入7 d* F) ]" A0 w, S" `
3.15- 数据处理之OCR图片识别
" D. m5 m1 X3 F; d 3.16 - 数据处理之对单网址进行补全: ~; R, Y& l F5 A9 N
3.17 - 数据处理之文件下载的设置方法
' B: f! [) W$ M( x2 O 3.18 - 数据处理之内容过滤相关设置
3 H$ d: R \4 X7 K 3.19 - 自定义固定格式的数据# b, Q9 f6 a3 O. W( Y5 l. J0 D3 G2 u
3.20- 如何循环采集一些数据* f {' e; R& k# v1 N) u
3.21 - 如何采集网址中的数据2 J H6 N& j# {
4.1 - Web在线发布到网址的设置方式 {3 r) {) }! _
4.2 - 将采集到的数据保存为本地TXT文件形式
+ y% j4 E& z, p# `3 |; C4 v: E' N: a 4.3 - 将采集到的数据保存为本地Word文件形式
$ r7 G1 x" W, A0 U/ B u 4.4 - 将采集到的数据保存为本地Excel文件形式
) ?" f( v1 v5 D; P. P* X 4.5- 将采集到的数据保存为本地Html文件形式5 y5 p8 ^- ?0 y
4.6 - 将采集到的数据保存为本地Csv文件形式1 i& m% p1 X" N9 L4 R1 Z
4.7 - 将采集到的数据导入到自定义数据库8 ^+ a& i: g( p
4.8 - 发布数据完成之后可以对数据进行哪些操作3 k; O8 b, ^% V3 {, r5 q: L
4.9 - 如何控制每次发布的数据的条数
9 ^) Q) m- h, a5 ?& @" o3 D 5.1 - 任务运行时线程设置的讲解
& u- l3 V5 s2 q. R: r# X; M 5.2 - 文件下载设置的相关注意事项
. L% l! Z4 a- J0 w 5.3 - FTP同步文件上传如何设置
/ g, q! _5 ? F) S2 n 5.4 - 如何给采集到的图片加上水印/ E4 |* x7 i' N- `+ U
$ Y: R k7 n% N% Y5 D; e6 c
|
|