|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
* g/ `0 e; ?. D. X/ E课程目录:
% W3 z9 R7 ^3 k- i" Z+ p0 T 1.1- 火车头采集器的安装和功能简介1 D% M- \; |& Z! [ d
1.2 - 火车头采集器的相关术语/ j9 B' d8 U% o% I2 q. R/ o5 {' r
1.3 - 火车头采集器的学习建议
6 N7 i5 M* w# s; T7 x: U# }2 U$ C& J 2.1 - 如何添加需要采集的单条网址" I* r6 d! a! G8 `- r+ M
2.2 - 如何添加批量和多页网址
% X+ z9 W* v: G# Q u5 G- Q 2.3 - 如何导入txt网址到开始采集地址3 r. ^* c: L4 d [" i( a, I
2.4 - 如何获取Rss地址中的网址作为起始网址9 v4 g# L' A1 D( }
2.5 - 如何自定义一些网址的格式来采集新的数据
# s( N$ W* [- Y/ x- Z 2.6 - 多级网址采集规则之从页面自动分析得到地址链接" |5 g0 b# p8 g, S9 S" L" s4 s, X
2.7- 多级网址采集规则之手动填写链接地址规则
" ^& F& [9 \6 z 2.8 - 多级网址采集规则之使用Xpath方式获取网址
4 K# p( V& \: K# Z8 A4 x' m 2.9 - 如何判断Http请求方式?是get还是post?, k5 r4 y0 y+ c% `# y7 F) }
2.10 - 多级网址采集规则之列表分页获取的方式
: T# I9 m4 U, S8 m 2.11 - 多级网址采集规则之附加参数是什么意思?9 r$ V; J5 l0 v) P
3.1 - 提取数据方式有哪些/ Q5 D) J- l+ T
3.2 - 数据处理之内容替换) L5 \- E; S7 ~9 ^8 v- y+ o
3.3 - 数据处理之Html标签过滤如何使用6 \7 t; n1 j! Y) W; ?7 Y) [/ P8 o
3.4 - 数据处理之字符截取
( R! _' p) m# @8 t5 `* p; h 3.5 - 数据处理之纯正则替换如何使用+ W1 M: q# H7 p8 h4 \: u; D
3.6 - 数据处理之数据转换$ a/ N" l# o, u2 O, r/ I
3.7 - 数据处理之自动摘要
c9 ?& M7 W+ ? l7 s/ n 3.8 - 数据处理之自动分词. d% r& Y* S6 Z5 |
3.9 - 数据处理之字符编码和解码
( b+ z5 R4 M- Y9 m: Q 3.10 - 数据处理之同义词替换5 Y5 [- J! W- h
3.11 - 数据处理之提取文章中的第一张图片
$ D8 ~9 S% U' u/ X8 C% k 3.12 - 数据处理之空内容缺省值
2 v$ B! J6 y/ n- | 3.13 - 数据处理之内容前后缀* y5 ? {4 z: {1 m& T+ o
3.14 - 数据处理之随机插入
6 o0 f4 s2 ]) O7 X 3.15- 数据处理之OCR图片识别
5 x# _: U! A4 Y2 P' F4 L+ y* ] 3.16 - 数据处理之对单网址进行补全0 A, E- K: M# t( T4 H& v& a* F" I
3.17 - 数据处理之文件下载的设置方法" s( _; p% g' D/ l8 ?
3.18 - 数据处理之内容过滤相关设置
) | {/ e, o: y$ s) x6 y% k 3.19 - 自定义固定格式的数据
% k! J, i- Q; q5 f2 P4 z 3.20- 如何循环采集一些数据
- j, E, j1 M4 a( G+ L 3.21 - 如何采集网址中的数据
, o$ @& h3 S1 K7 W9 z; s2 h 4.1 - Web在线发布到网址的设置方式7 ~3 K! a1 W7 y# d
4.2 - 将采集到的数据保存为本地TXT文件形式6 b) S; Y7 ^# ]. y5 Z* V9 u& y
4.3 - 将采集到的数据保存为本地Word文件形式
" l6 A, U( ^* P, a5 M2 l 4.4 - 将采集到的数据保存为本地Excel文件形式$ w8 j* `/ e B: C7 K
4.5- 将采集到的数据保存为本地Html文件形式
/ ~3 m* F% V8 f 4.6 - 将采集到的数据保存为本地Csv文件形式' ~' ]) z; o5 k+ O2 S. ^# B# ^4 G
4.7 - 将采集到的数据导入到自定义数据库
) @% Z& R7 l8 s% o/ _7 v4 H* J# m7 q 4.8 - 发布数据完成之后可以对数据进行哪些操作' |! K. s! }0 ?( |; R
4.9 - 如何控制每次发布的数据的条数. p& ^* x5 g0 ~: M( X( g
5.1 - 任务运行时线程设置的讲解$ `& L# t6 x$ J
5.2 - 文件下载设置的相关注意事项
b' E9 ]* [6 l/ j 5.3 - FTP同步文件上传如何设置
0 t( @. M: L5 o/ T1 _ 5.4 - 如何给采集到的图片加上水印; f7 d1 A3 A3 b( w
# `; V8 ^4 a3 Q- j7 i5 e1 }
|
|