QQ登录

只需要一步,快速开始

APP扫码登录

只需要一步,快速开始

手机号码,快捷登录

手机号码,快捷登录

查看: 2927|回复: 0

使用火车头采集器入门教程

[复制链接]

等级头衔

积分成就    金币 : 2857
   泡泡 : 1516
   精华 : 6
   在线时间 : 1317 小时
   最后登录 : 2025-4-23

丰功伟绩

优秀达人突出贡献荣誉管理论坛元老活跃会员

联系方式
发表于 2021-6-17 10:17:51 | 显示全部楼层 |阅读模式
       学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
4 b) S8 e+ B% h课程目录:4 W4 l! Y7 W- ~
  1.1- 火车头采集器的安装和功能简介4 @- a; m' D: z
  1.2 - 火车头采集器的相关术语
7 T7 L$ ~$ v' p3 \* a  1.3 - 火车头采集器的学习建议
" n& {9 V6 ^3 n' M  2.1 - 如何添加需要采集的单条网址
/ ?0 L# s, p9 W7 l% R% D! q8 B  2.2 - 如何添加批量和多页网址" O* b' F% L; ?+ ]! x  @
  2.3 - 如何导入txt网址到开始采集地址
( \" y" I1 q5 M- [  2.4 - 如何获取Rss地址中的网址作为起始网址
" ]5 z5 f* m* z, Y9 B  2.5 - 如何自定义一些网址的格式来采集新的数据
: [. T- `1 T( v$ L0 H# s4 u  2.6 - 多级网址采集规则之从页面自动分析得到地址链接; S. z) a! O# H
  2.7- 多级网址采集规则之手动填写链接地址规则
" l' M- C. l+ K) R# R& z( E  2.8 - 多级网址采集规则之使用Xpath方式获取网址' z6 T, g/ ^, W. a; p" E
  2.9 - 如何判断Http请求方式?是get还是post?
: ^& u6 K: r% H; j2 [& l  2.10 - 多级网址采集规则之列表分页获取的方式# S! Y0 j! j- B
  2.11 - 多级网址采集规则之附加参数是什么意思?$ H) f' ?3 k4 k; ~; E1 g
  3.1 - 提取数据方式有哪些1 U; T1 A, L: ^3 i' h, R9 @
  3.2 - 数据处理之内容替换
) V1 o7 ]' B) w  3.3 - 数据处理之Html标签过滤如何使用/ W! o5 D3 D& v5 W, I2 ~
  3.4 - 数据处理之字符截取
* {$ }6 O" E$ u' m1 Y2 z  3.5 - 数据处理之纯正则替换如何使用
, D$ j8 ]8 `& g  3.6 - 数据处理之数据转换
( X5 Y+ W& ^0 X  H1 y) j  3.7 - 数据处理之自动摘要
3 K' }0 Q$ p, m: w1 `  3.8 - 数据处理之自动分词, _: c: {* g8 ]$ I' U' t
  3.9 - 数据处理之字符编码和解码
) x8 V  l  H& G% p+ m! L. H9 P" G  3.10 - 数据处理之同义词替换. {- J! X# l. @, q, M% W
  3.11 - 数据处理之提取文章中的第一张图片. O! I' q4 ]8 N) c9 Y1 S& A
  3.12 - 数据处理之空内容缺省值
# `- |  r0 P3 C  3.13 - 数据处理之内容前后缀, E+ k8 b/ `' v2 r9 j4 Y' e
  3.14 - 数据处理之随机插入
# _/ g4 e' @' g4 g9 [# I  3.15- 数据处理之OCR图片识别
% N5 H7 A5 u& e  3.16 - 数据处理之对单网址进行补全
/ Q6 ]0 n, Y$ G) S, z6 U  3.17 - 数据处理之文件下载的设置方法3 _* u0 N* f( ?" ?% X9 H
  3.18 - 数据处理之内容过滤相关设置$ j  ]7 {! [0 I9 U( ~
  3.19 - 自定义固定格式的数据' x% z4 O  C2 k9 ]0 t8 d8 [
  3.20- 如何循环采集一些数据
2 W/ N3 |0 W2 y+ P$ f2 t8 X  3.21 - 如何采集网址中的数据4 T' ?) C1 A) W7 O- b; N
  4.1 - Web在线发布到网址的设置方式
; _% E  N1 o9 D; o/ }  4.2 - 将采集到的数据保存为本地TXT文件形式
8 W  D4 A# v. R6 ^  4.3 - 将采集到的数据保存为本地Word文件形式
3 v$ T. L  j# L- {2 r8 N  4.4 - 将采集到的数据保存为本地Excel文件形式
4 }; c2 n) f3 y2 q  4.5- 将采集到的数据保存为本地Html文件形式0 e& \( {* e" ~% M5 O2 K. i! y6 K. \: H
  4.6 - 将采集到的数据保存为本地Csv文件形式- S& l3 o8 a, j1 k/ w; G
  4.7 - 将采集到的数据导入到自定义数据库% i% C9 m0 W: k$ e
  4.8 - 发布数据完成之后可以对数据进行哪些操作
) H, t4 n: X& ?' n  4.9 - 如何控制每次发布的数据的条数; A9 X& q  k1 W5 ]* N3 p
  5.1 - 任务运行时线程设置的讲解$ g" Z8 d4 \. Z, }7 ~* ?% z: g+ b- m
  5.2 - 文件下载设置的相关注意事项2 u9 e# d7 u) H- O
  5.3 - FTP同步文件上传如何设置" D1 G4 f( A8 o7 ?% J
  5.4 - 如何给采集到的图片加上水印
% u& I8 o+ {6 U2 B/ ]1 w2 {
% s* V+ I8 J1 o9 g* W 1.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|paopaomj.COM ( 渝ICP备18007172号|渝公网安备50010502503914号 )

GMT+8, 2025-4-25 09:10

Powered by paopaomj X3.5 © 2016-2025 sitemap

快速回复 返回顶部 返回列表