QQ登录

只需要一步,快速开始

APP扫码登录

只需要一步,快速开始

查看: 4547|回复: 0

使用火车头采集器入门教程

[复制链接]

等级头衔

积分成就    金币 : 2861
   泡泡 : 1516
   精华 : 6
   在线时间 : 1322 小时
   最后登录 : 2025-11-29

丰功伟绩

优秀达人突出贡献荣誉管理论坛元老活跃会员

联系方式
发表于 2021-6-17 10:17:51 | 显示全部楼层 |阅读模式
       学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
8 q0 H  W( w" I7 X4 z课程目录:
2 B3 ^: d- |/ @; T  J  1.1- 火车头采集器的安装和功能简介
% {9 ?; ~0 s* G& @- y  1.2 - 火车头采集器的相关术语
+ X- ^+ J1 i8 D  1.3 - 火车头采集器的学习建议1 V' ^. u  |1 I) S
  2.1 - 如何添加需要采集的单条网址* v" a% M9 Y, S2 {; I. m
  2.2 - 如何添加批量和多页网址
5 Y( e) L0 v# {  2.3 - 如何导入txt网址到开始采集地址
; M1 W2 @8 {" O+ N2 e% x  2.4 - 如何获取Rss地址中的网址作为起始网址/ K+ n! _! `5 Z& H  E4 J9 ?  C8 P
  2.5 - 如何自定义一些网址的格式来采集新的数据/ L6 t, u/ t6 ]  p8 ~
  2.6 - 多级网址采集规则之从页面自动分析得到地址链接9 d* p) C9 N) m" {) A4 s7 X, ]
  2.7- 多级网址采集规则之手动填写链接地址规则& x+ k: @% h2 B5 `; t
  2.8 - 多级网址采集规则之使用Xpath方式获取网址3 f$ c/ h7 T; H5 ^7 V5 s
  2.9 - 如何判断Http请求方式?是get还是post?3 V: e$ _2 A- D4 q* A
  2.10 - 多级网址采集规则之列表分页获取的方式
$ [  }4 M% ?0 I  2.11 - 多级网址采集规则之附加参数是什么意思?% u( a; m, h9 e( H  r
  3.1 - 提取数据方式有哪些
! l# ~( f6 e8 E; M" N) B  3.2 - 数据处理之内容替换1 f$ H6 i5 f4 E* S* L4 i4 T* F
  3.3 - 数据处理之Html标签过滤如何使用
$ W1 Q9 l+ z, N6 i/ k" e( E  3.4 - 数据处理之字符截取
% Y: @/ @) |& I; |4 U& [  3.5 - 数据处理之纯正则替换如何使用. e$ a, f$ S! T
  3.6 - 数据处理之数据转换
# K* c8 f) U+ L/ i! Y' ~  3.7 - 数据处理之自动摘要0 V0 W" M! V/ ?4 @
  3.8 - 数据处理之自动分词0 T3 [: J: w1 [  ?1 W2 f
  3.9 - 数据处理之字符编码和解码
3 m: l% ^* B% h5 y$ M0 j6 X  3.10 - 数据处理之同义词替换
$ k; T" F/ `; G6 M" T  3.11 - 数据处理之提取文章中的第一张图片+ x0 A6 g# v! C4 v, x2 N2 s2 g0 A
  3.12 - 数据处理之空内容缺省值) {0 h" Q% W4 E& _: l
  3.13 - 数据处理之内容前后缀
  N, G6 D/ s( J! R  3.14 - 数据处理之随机插入! c  x! i" E0 L/ Z1 E
  3.15- 数据处理之OCR图片识别0 x. W+ d' Y, [9 g9 o& n
  3.16 - 数据处理之对单网址进行补全9 E+ }) Q* `0 X8 h2 E
  3.17 - 数据处理之文件下载的设置方法& R3 C" U8 u9 G$ K) Q7 \
  3.18 - 数据处理之内容过滤相关设置
! V- C1 B. B& S/ n" [# r  3.19 - 自定义固定格式的数据% e9 K. R; J! o  F  p2 C
  3.20- 如何循环采集一些数据
! a! ]6 X; E; X1 X  3.21 - 如何采集网址中的数据; U; Z6 @2 x* R" C; L
  4.1 - Web在线发布到网址的设置方式/ }& u( N/ A; A0 g" ^$ n. O
  4.2 - 将采集到的数据保存为本地TXT文件形式
" h  U  a/ n! _2 k* e% J  4.3 - 将采集到的数据保存为本地Word文件形式
0 E; t- N7 y5 [/ o  B7 ?  4.4 - 将采集到的数据保存为本地Excel文件形式
$ E6 s" k5 L2 m# w; ~0 J  4.5- 将采集到的数据保存为本地Html文件形式; z" \) _1 Q" E" \* d
  4.6 - 将采集到的数据保存为本地Csv文件形式. ]8 u1 Z( O, y$ }1 t8 s0 o/ |
  4.7 - 将采集到的数据导入到自定义数据库' d% j+ K2 d) s+ w/ f4 R
  4.8 - 发布数据完成之后可以对数据进行哪些操作- h( G. \) [1 l) x$ ?0 ~
  4.9 - 如何控制每次发布的数据的条数$ k3 X+ v1 U& Q
  5.1 - 任务运行时线程设置的讲解/ S1 d1 M1 j6 x7 `; y# S
  5.2 - 文件下载设置的相关注意事项
) y5 H9 a* U- x$ _  5.3 - FTP同步文件上传如何设置+ a7 {" t. R; X2 r9 @' M
  5.4 - 如何给采集到的图片加上水印
0 Z( N( Q" Z% @; N/ W 1 V  p$ L( O: A  n
1.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|paopaomj.COM ( 渝ICP备18007172号|渝公网安备50010502503914号 )

GMT+8, 2026-1-7 06:17

Powered by paopaomj X3.5 © 2016-2025 sitemap

快速回复 返回顶部 返回列表