QQ登录

只需要一步,快速开始

APP扫码登录

只需要一步,快速开始

查看: 5026|回复: 0

使用火车头采集器入门教程

[复制链接]

等级头衔

积分成就    金币 : 2861
   泡泡 : 1516
   精华 : 6
   在线时间 : 1328 小时
   最后登录 : 2026-5-15

丰功伟绩

优秀达人突出贡献荣誉管理论坛元老活跃会员

联系方式
发表于 2021-6-17 10:17:51 | 显示全部楼层 |阅读模式
       学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
  A+ N) Q9 X% \7 v4 F* W课程目录:% X! H3 V- n2 M0 T
  1.1- 火车头采集器的安装和功能简介4 c, f( p0 U6 H3 k
  1.2 - 火车头采集器的相关术语& Q! G+ o/ U8 y1 T: j0 Y; Z' p# ~
  1.3 - 火车头采集器的学习建议; v( @8 Y  G) c2 Q- K# g
  2.1 - 如何添加需要采集的单条网址; w4 V$ T" o& x- ?. |! P8 _
  2.2 - 如何添加批量和多页网址- k- v* ]- ], X2 i4 H; v; X
  2.3 - 如何导入txt网址到开始采集地址1 _3 R: u: o7 k( e% Y
  2.4 - 如何获取Rss地址中的网址作为起始网址
* A# ]+ b. ]7 H+ D9 I  2.5 - 如何自定义一些网址的格式来采集新的数据
6 f; U3 J" `, }& A  2.6 - 多级网址采集规则之从页面自动分析得到地址链接3 g% ]: \5 K: d' F6 Q. B2 R8 a
  2.7- 多级网址采集规则之手动填写链接地址规则
0 }5 z( v9 G7 v4 \' P0 B  2.8 - 多级网址采集规则之使用Xpath方式获取网址9 T' N+ a0 @& K# r0 q
  2.9 - 如何判断Http请求方式?是get还是post?" T/ x6 s( w* V' a. @! W8 ~) R! c
  2.10 - 多级网址采集规则之列表分页获取的方式/ z3 R- j) g" v
  2.11 - 多级网址采集规则之附加参数是什么意思?/ G4 U" n! f( w0 {
  3.1 - 提取数据方式有哪些# w" J! Q5 B" T2 Z
  3.2 - 数据处理之内容替换2 r* Y7 v6 v$ X" G+ r
  3.3 - 数据处理之Html标签过滤如何使用; w4 w3 k2 u" _4 Z% m1 ~
  3.4 - 数据处理之字符截取. y. v/ h% w# G8 a
  3.5 - 数据处理之纯正则替换如何使用" I" r$ m' l# m* K  W! L; I* T
  3.6 - 数据处理之数据转换
3 v' \3 `# `6 V  3.7 - 数据处理之自动摘要
! C+ @6 g# C8 k# C. h( [  3.8 - 数据处理之自动分词
$ F0 M  R4 P; J/ u6 {% K  3.9 - 数据处理之字符编码和解码9 E8 P2 Y+ I2 _" ^9 m1 [
  3.10 - 数据处理之同义词替换
& P; _  E# Z5 n0 |- s3 F  3.11 - 数据处理之提取文章中的第一张图片, ^9 p( Z" J$ V2 ?, x
  3.12 - 数据处理之空内容缺省值. Z+ H( J, e, @, n4 V- ~
  3.13 - 数据处理之内容前后缀8 U0 @* ?9 r- Z4 c& v" b. Y/ _
  3.14 - 数据处理之随机插入7 d* F) ]" A0 w, S" `
  3.15- 数据处理之OCR图片识别
" D. m5 m1 X3 F; d  3.16 - 数据处理之对单网址进行补全: ~; R, Y& l  F5 A9 N
  3.17 - 数据处理之文件下载的设置方法
' B: f! [) W$ M( x2 O  3.18 - 数据处理之内容过滤相关设置
3 H$ d: R  \4 X7 K  3.19 - 自定义固定格式的数据# b, Q9 f6 a3 O. W( Y5 l. J0 D3 G2 u
  3.20- 如何循环采集一些数据* f  {' e; R& k# v1 N) u
  3.21 - 如何采集网址中的数据2 J  H6 N& j# {
  4.1 - Web在线发布到网址的设置方式  {3 r) {) }! _
  4.2 - 将采集到的数据保存为本地TXT文件形式
+ y% j4 E& z, p# `3 |; C4 v: E' N: a  4.3 - 将采集到的数据保存为本地Word文件形式
$ r7 G1 x" W, A0 U/ B  u  4.4 - 将采集到的数据保存为本地Excel文件形式
) ?" f( v1 v5 D; P. P* X  4.5- 将采集到的数据保存为本地Html文件形式5 y5 p8 ^- ?0 y
  4.6 - 将采集到的数据保存为本地Csv文件形式1 i& m% p1 X" N9 L4 R1 Z
  4.7 - 将采集到的数据导入到自定义数据库8 ^+ a& i: g( p
  4.8 - 发布数据完成之后可以对数据进行哪些操作3 k; O8 b, ^% V3 {, r5 q: L
  4.9 - 如何控制每次发布的数据的条数
9 ^) Q) m- h, a5 ?& @" o3 D  5.1 - 任务运行时线程设置的讲解
& u- l3 V5 s2 q. R: r# X; M  5.2 - 文件下载设置的相关注意事项
. L% l! Z4 a- J0 w  5.3 - FTP同步文件上传如何设置
/ g, q! _5 ?  F) S2 n  5.4 - 如何给采集到的图片加上水印/ E4 |* x7 i' N- `+ U

$ Y: R  k7 n% N% Y5 D; e6 c 1.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|paopaomj.COM ( 渝ICP备18007172号|渝公网安备50010502503914号 )

GMT+8, 2026-7-2 19:55

Powered by paopaomj X3.5 © 2016-2025 sitemap

快速回复 返回顶部 返回列表