QQ登录

只需要一步,快速开始

APP扫码登录

只需要一步,快速开始

查看: 3180|回复: 0

使用火车头采集器入门教程

[复制链接]

等级头衔

积分成就    金币 : 2861
   泡泡 : 1516
   精华 : 6
   在线时间 : 1320 小时
   最后登录 : 2025-6-27

丰功伟绩

优秀达人突出贡献荣誉管理论坛元老活跃会员

联系方式
发表于 2021-6-17 10:17:51 | 显示全部楼层 |阅读模式
       学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。2 q9 j2 J+ y1 S
课程目录:3 Z0 k  l+ }  b9 A8 H) H% k
  1.1- 火车头采集器的安装和功能简介9 W4 o: b3 q- ?- z
  1.2 - 火车头采集器的相关术语
6 H5 s7 U4 p( L: M8 C6 G  1.3 - 火车头采集器的学习建议4 i- e4 E! H' j3 _
  2.1 - 如何添加需要采集的单条网址. J5 f. i$ C% z: d
  2.2 - 如何添加批量和多页网址
4 f  ]" V  Y$ p, @( k  2.3 - 如何导入txt网址到开始采集地址- W+ k+ Y4 j, c9 l
  2.4 - 如何获取Rss地址中的网址作为起始网址
% E( z2 m( n2 R% O( m  2.5 - 如何自定义一些网址的格式来采集新的数据- N( A6 u/ F+ A' Z) j0 L
  2.6 - 多级网址采集规则之从页面自动分析得到地址链接
6 A- v' i" }' v/ X7 i6 O( I  2.7- 多级网址采集规则之手动填写链接地址规则
$ f7 d  [$ ?$ l" z) |0 C  2.8 - 多级网址采集规则之使用Xpath方式获取网址
. k3 w8 L) q, O+ }  {) v  2.9 - 如何判断Http请求方式?是get还是post?1 Y% X* G5 Q2 B' i/ l
  2.10 - 多级网址采集规则之列表分页获取的方式& o* |! I9 }' c# _+ a
  2.11 - 多级网址采集规则之附加参数是什么意思?
& p' i1 i) T4 m& \4 o# _/ M  h4 q  3.1 - 提取数据方式有哪些' I; |6 I9 P9 |" n. h9 W3 V9 _$ z
  3.2 - 数据处理之内容替换' b- i3 S4 \; ?6 M* L1 M
  3.3 - 数据处理之Html标签过滤如何使用9 s! G3 L* W& \  x. g$ k
  3.4 - 数据处理之字符截取
7 z$ D, t6 L# |' m. }  3.5 - 数据处理之纯正则替换如何使用
! {- k0 b& F2 z2 ]2 {  3.6 - 数据处理之数据转换
! ]2 l8 r% S' \! L  3.7 - 数据处理之自动摘要& w6 P& a& H0 |6 ~
  3.8 - 数据处理之自动分词
3 E3 u0 Q, L& I- t% F1 y  3.9 - 数据处理之字符编码和解码( H! ]8 k% H1 z  D7 H  _3 f4 E
  3.10 - 数据处理之同义词替换, G# ]8 E8 e5 W
  3.11 - 数据处理之提取文章中的第一张图片
) `" c6 G2 f6 h8 L) s  3.12 - 数据处理之空内容缺省值% [: X7 `' M9 C
  3.13 - 数据处理之内容前后缀% ~( P& V8 `0 a3 `: O0 D* R
  3.14 - 数据处理之随机插入
2 h1 _+ n5 o4 E$ x( E  3.15- 数据处理之OCR图片识别' d( K# E2 a, R. M7 {8 U+ z
  3.16 - 数据处理之对单网址进行补全
7 \8 W" c6 Q. Z- U# ]3 S: l9 Q  3.17 - 数据处理之文件下载的设置方法+ a4 T  a1 P2 e2 q' C1 ^. Q
  3.18 - 数据处理之内容过滤相关设置+ s- N8 g0 V- t$ ?. j$ f
  3.19 - 自定义固定格式的数据% p+ E4 i0 h. B) n2 m
  3.20- 如何循环采集一些数据9 M1 Y) U; `: j, S: x1 m
  3.21 - 如何采集网址中的数据
: ~, m  k. b/ @& q4 F1 g5 \% Y  4.1 - Web在线发布到网址的设置方式
8 o9 m4 P- z" Y: ?' |  4.2 - 将采集到的数据保存为本地TXT文件形式
5 L- C' g$ C- C9 D! }  4.3 - 将采集到的数据保存为本地Word文件形式
$ E2 G8 ^; K' K$ y  4.4 - 将采集到的数据保存为本地Excel文件形式
& S0 R1 H! F6 w' D7 C8 Q& s  4.5- 将采集到的数据保存为本地Html文件形式
9 e$ n) ]9 m  i) [. Q  4.6 - 将采集到的数据保存为本地Csv文件形式1 [9 ]& y* c' r( J
  4.7 - 将采集到的数据导入到自定义数据库4 Z, Y/ \. [' h! M" Y
  4.8 - 发布数据完成之后可以对数据进行哪些操作
5 }+ \2 H( p7 l" R# P  4.9 - 如何控制每次发布的数据的条数
/ h. Q: u7 T, _6 K  5.1 - 任务运行时线程设置的讲解4 H# Y% @( \- p
  5.2 - 文件下载设置的相关注意事项0 ^$ U  Y# w5 D- Q, o7 W
  5.3 - FTP同步文件上传如何设置
+ g9 w- U% Y# x% w) E  5.4 - 如何给采集到的图片加上水印
! B1 S/ B% @; l% v 2 o$ Y' \$ ^# j' ]# y
1.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|paopaomj.COM ( 渝ICP备18007172号|渝公网安备50010502503914号 )

GMT+8, 2025-6-28 12:08

Powered by paopaomj X3.5 © 2016-2025 sitemap

快速回复 返回顶部 返回列表