QQ登录

只需要一步,快速开始

APP扫码登录

只需要一步,快速开始

查看: 4600|回复: 0

使用火车头采集器入门教程

[复制链接]

等级头衔

积分成就    金币 : 2861
   泡泡 : 1516
   精华 : 6
   在线时间 : 1322 小时
   最后登录 : 2026-1-12

丰功伟绩

优秀达人突出贡献荣誉管理论坛元老活跃会员

联系方式
发表于 2021-6-17 10:17:51 | 显示全部楼层 |阅读模式
       学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
3 r0 e+ P4 I7 L2 j  j* @课程目录:
  q! U% N+ H& y) }, e  1.1- 火车头采集器的安装和功能简介+ K) q( n. i8 Z0 }" x/ m2 ^3 B
  1.2 - 火车头采集器的相关术语" I9 k& f  J2 R. _1 u# ?$ [
  1.3 - 火车头采集器的学习建议3 E0 k7 V0 F( J' E1 Y, R5 e" v9 h
  2.1 - 如何添加需要采集的单条网址
3 }; `. B; a7 R' S/ D# n" j' ]  2.2 - 如何添加批量和多页网址! n6 v$ z& S) p( v9 H- b: E) Q0 i8 }
  2.3 - 如何导入txt网址到开始采集地址
0 a, a0 ^7 ^: z3 y5 c* P) d% |4 y  2.4 - 如何获取Rss地址中的网址作为起始网址- g$ K  ?  k7 j7 f
  2.5 - 如何自定义一些网址的格式来采集新的数据
* z* e+ B, j5 y; w# G  2.6 - 多级网址采集规则之从页面自动分析得到地址链接3 f  j  M$ o! g! P9 R& ?2 Q; M" n
  2.7- 多级网址采集规则之手动填写链接地址规则
( w% _% L: Y6 O, o1 G6 X) U) }2 _5 C  2.8 - 多级网址采集规则之使用Xpath方式获取网址
# _) {2 {3 }- a6 j0 z  2.9 - 如何判断Http请求方式?是get还是post?4 M+ Y8 Q9 ]3 ~0 y
  2.10 - 多级网址采集规则之列表分页获取的方式
+ y( Q1 Y% \5 T6 H/ o; S7 o  2.11 - 多级网址采集规则之附加参数是什么意思?
, H4 _+ {4 W$ a" u  3.1 - 提取数据方式有哪些
6 D/ P9 h+ s, G1 D/ R  3.2 - 数据处理之内容替换
; J# [6 i+ D5 {$ a4 |6 d0 M9 q  M4 g  3.3 - 数据处理之Html标签过滤如何使用
6 y0 Q0 d  Y) j+ Y' _  3.4 - 数据处理之字符截取! A  h4 S6 q# Q# |& S
  3.5 - 数据处理之纯正则替换如何使用( m' n2 X  d# {$ n" j
  3.6 - 数据处理之数据转换
0 S6 m4 a& Q7 Q9 }  3.7 - 数据处理之自动摘要
2 q. G0 s# c& l6 u9 }  3.8 - 数据处理之自动分词/ I; \, J& X7 D2 }$ W( y
  3.9 - 数据处理之字符编码和解码
  {2 @8 ^5 D( }; Z8 s& U' N  3.10 - 数据处理之同义词替换
* a& h1 Z! V$ a8 [/ k% e/ B# J  3.11 - 数据处理之提取文章中的第一张图片
8 r& g% X: p9 }4 _1 p" C  3.12 - 数据处理之空内容缺省值
! X8 M7 [3 M1 a7 K' l  3.13 - 数据处理之内容前后缀
; u0 j4 Q1 ?  f  3.14 - 数据处理之随机插入
+ j6 H* l3 u4 p* |. {$ X  3.15- 数据处理之OCR图片识别
9 y0 b2 N! e/ v1 I' Y- n& W3 S  3.16 - 数据处理之对单网址进行补全4 D  X' W% ^% \6 M! \. n
  3.17 - 数据处理之文件下载的设置方法$ E7 ~9 v0 T! _9 k% N0 ~
  3.18 - 数据处理之内容过滤相关设置, U' p: O3 u! L$ t7 Q
  3.19 - 自定义固定格式的数据
* E% _, q+ h1 f2 c$ k- {  3.20- 如何循环采集一些数据
4 r1 X$ y5 v  l: e' K  3.21 - 如何采集网址中的数据
7 m& H4 Z, B8 A4 O' F/ W2 e  4.1 - Web在线发布到网址的设置方式4 ^* O% s" G$ H9 H: r0 v) f$ Z! J
  4.2 - 将采集到的数据保存为本地TXT文件形式) u& T& V' x6 f3 J
  4.3 - 将采集到的数据保存为本地Word文件形式/ g$ ?2 H8 o8 S8 H7 A" {/ q
  4.4 - 将采集到的数据保存为本地Excel文件形式
4 H+ k" Y0 w* A! O  ?  4.5- 将采集到的数据保存为本地Html文件形式
1 @+ u! o% U3 L3 w/ A* J! W6 ^& O  4.6 - 将采集到的数据保存为本地Csv文件形式
/ e: Z: ~; x1 E- f) R  4.7 - 将采集到的数据导入到自定义数据库
. S; q$ ]6 f( a. ]  4.8 - 发布数据完成之后可以对数据进行哪些操作# n! Q) k5 o- v. e1 ]8 [' x6 z
  4.9 - 如何控制每次发布的数据的条数) F# R4 y# z/ V
  5.1 - 任务运行时线程设置的讲解: |" h& O+ z$ {3 C' N7 q9 t
  5.2 - 文件下载设置的相关注意事项, x9 i% b$ e  f  Z, i
  5.3 - FTP同步文件上传如何设置
5 _2 \) g  Z0 F. W: j6 |" v  5.4 - 如何给采集到的图片加上水印
6 x# \7 b# _+ W7 J+ f) c 4 y. u2 D7 S- C
1.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|paopaomj.COM ( 渝ICP备18007172号|渝公网安备50010502503914号 )

GMT+8, 2026-1-28 00:34

Powered by paopaomj X3.5 © 2016-2025 sitemap

快速回复 返回顶部 返回列表