|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
4 b) S8 e+ B% h课程目录:4 W4 l! Y7 W- ~
1.1- 火车头采集器的安装和功能简介4 @- a; m' D: z
1.2 - 火车头采集器的相关术语
7 T7 L$ ~$ v' p3 \* a 1.3 - 火车头采集器的学习建议
" n& {9 V6 ^3 n' M 2.1 - 如何添加需要采集的单条网址
/ ?0 L# s, p9 W7 l% R% D! q8 B 2.2 - 如何添加批量和多页网址" O* b' F% L; ?+ ]! x @
2.3 - 如何导入txt网址到开始采集地址
( \" y" I1 q5 M- [ 2.4 - 如何获取Rss地址中的网址作为起始网址
" ]5 z5 f* m* z, Y9 B 2.5 - 如何自定义一些网址的格式来采集新的数据
: [. T- `1 T( v$ L0 H# s4 u 2.6 - 多级网址采集规则之从页面自动分析得到地址链接; S. z) a! O# H
2.7- 多级网址采集规则之手动填写链接地址规则
" l' M- C. l+ K) R# R& z( E 2.8 - 多级网址采集规则之使用Xpath方式获取网址' z6 T, g/ ^, W. a; p" E
2.9 - 如何判断Http请求方式?是get还是post?
: ^& u6 K: r% H; j2 [& l 2.10 - 多级网址采集规则之列表分页获取的方式# S! Y0 j! j- B
2.11 - 多级网址采集规则之附加参数是什么意思?$ H) f' ?3 k4 k; ~; E1 g
3.1 - 提取数据方式有哪些1 U; T1 A, L: ^3 i' h, R9 @
3.2 - 数据处理之内容替换
) V1 o7 ]' B) w 3.3 - 数据处理之Html标签过滤如何使用/ W! o5 D3 D& v5 W, I2 ~
3.4 - 数据处理之字符截取
* {$ }6 O" E$ u' m1 Y2 z 3.5 - 数据处理之纯正则替换如何使用
, D$ j8 ]8 `& g 3.6 - 数据处理之数据转换
( X5 Y+ W& ^0 X H1 y) j 3.7 - 数据处理之自动摘要
3 K' }0 Q$ p, m: w1 ` 3.8 - 数据处理之自动分词, _: c: {* g8 ]$ I' U' t
3.9 - 数据处理之字符编码和解码
) x8 V l H& G% p+ m! L. H9 P" G 3.10 - 数据处理之同义词替换. {- J! X# l. @, q, M% W
3.11 - 数据处理之提取文章中的第一张图片. O! I' q4 ]8 N) c9 Y1 S& A
3.12 - 数据处理之空内容缺省值
# `- | r0 P3 C 3.13 - 数据处理之内容前后缀, E+ k8 b/ `' v2 r9 j4 Y' e
3.14 - 数据处理之随机插入
# _/ g4 e' @' g4 g9 [# I 3.15- 数据处理之OCR图片识别
% N5 H7 A5 u& e 3.16 - 数据处理之对单网址进行补全
/ Q6 ]0 n, Y$ G) S, z6 U 3.17 - 数据处理之文件下载的设置方法3 _* u0 N* f( ?" ?% X9 H
3.18 - 数据处理之内容过滤相关设置$ j ]7 {! [0 I9 U( ~
3.19 - 自定义固定格式的数据' x% z4 O C2 k9 ]0 t8 d8 [
3.20- 如何循环采集一些数据
2 W/ N3 |0 W2 y+ P$ f2 t8 X 3.21 - 如何采集网址中的数据4 T' ?) C1 A) W7 O- b; N
4.1 - Web在线发布到网址的设置方式
; _% E N1 o9 D; o/ } 4.2 - 将采集到的数据保存为本地TXT文件形式
8 W D4 A# v. R6 ^ 4.3 - 将采集到的数据保存为本地Word文件形式
3 v$ T. L j# L- {2 r8 N 4.4 - 将采集到的数据保存为本地Excel文件形式
4 }; c2 n) f3 y2 q 4.5- 将采集到的数据保存为本地Html文件形式0 e& \( {* e" ~% M5 O2 K. i! y6 K. \: H
4.6 - 将采集到的数据保存为本地Csv文件形式- S& l3 o8 a, j1 k/ w; G
4.7 - 将采集到的数据导入到自定义数据库% i% C9 m0 W: k$ e
4.8 - 发布数据完成之后可以对数据进行哪些操作
) H, t4 n: X& ?' n 4.9 - 如何控制每次发布的数据的条数; A9 X& q k1 W5 ]* N3 p
5.1 - 任务运行时线程设置的讲解$ g" Z8 d4 \. Z, }7 ~* ?% z: g+ b- m
5.2 - 文件下载设置的相关注意事项2 u9 e# d7 u) H- O
5.3 - FTP同步文件上传如何设置" D1 G4 f( A8 o7 ?% J
5.4 - 如何给采集到的图片加上水印
% u& I8 o+ {6 U2 B/ ]1 w2 {
% s* V+ I8 J1 o9 g* W
|
|