QQ登录

只需要一步,快速开始

APP扫码登录

只需要一步,快速开始

手机号码,快捷登录

手机号码,快捷登录

查看: 2420|回复: 0

使用火车头采集器入门教程

[复制链接]

等级头衔

积分成就    金币 : 2851
   泡泡 : 1516
   精华 : 6
   在线时间 : 1301 小时
   最后登录 : 2024-12-4

丰功伟绩

优秀达人突出贡献荣誉管理论坛元老活跃会员

联系方式
发表于 2021-6-17 10:17:51 | 显示全部楼层 |阅读模式
       学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。, V* w$ ]7 I! `. J( Z0 ^
课程目录:
% ?  M: p" N2 j( Q/ a' c  1.1- 火车头采集器的安装和功能简介) `1 r6 v  u$ h3 J
  1.2 - 火车头采集器的相关术语/ J- L* @  u# b: {, ^
  1.3 - 火车头采集器的学习建议
* L2 F8 D5 B8 Y$ t/ r  2.1 - 如何添加需要采集的单条网址* U% K$ G1 I5 }$ B4 }0 @0 a( ?" {
  2.2 - 如何添加批量和多页网址: b6 N6 q/ Z' v8 V3 ^
  2.3 - 如何导入txt网址到开始采集地址
, |# B5 ?7 |* `8 k) d  2.4 - 如何获取Rss地址中的网址作为起始网址
  E' R, P- r: j1 w* T$ d  2.5 - 如何自定义一些网址的格式来采集新的数据
$ Y3 G0 O+ E1 U8 E& ]  2.6 - 多级网址采集规则之从页面自动分析得到地址链接
+ J7 N4 c+ F! a9 w, s, q6 m  2.7- 多级网址采集规则之手动填写链接地址规则: ~/ M, m; p; G; O4 T7 [. c8 q
  2.8 - 多级网址采集规则之使用Xpath方式获取网址
- n& p" i# h2 L$ [' D& }  2.9 - 如何判断Http请求方式?是get还是post?
$ i7 B$ \9 v3 h: ^# L  2.10 - 多级网址采集规则之列表分页获取的方式
- _4 j, _$ F' \7 e  2.11 - 多级网址采集规则之附加参数是什么意思?
& S0 ?. {6 i/ K" I/ b  h  3.1 - 提取数据方式有哪些" m) w* }* }1 |8 J
  3.2 - 数据处理之内容替换
+ j' ?% M* E5 j8 l3 N, P  3.3 - 数据处理之Html标签过滤如何使用
, o* l0 r% E# ~% y  3.4 - 数据处理之字符截取% M/ v. ~+ g& C
  3.5 - 数据处理之纯正则替换如何使用
. c& G. [; ~0 s) W/ ~: m+ k  3.6 - 数据处理之数据转换
% E6 g# m0 K+ t. w6 A  3.7 - 数据处理之自动摘要
! i+ A4 C6 i! F6 J& O  3.8 - 数据处理之自动分词9 _# I) }/ ]2 F- ^7 d" |
  3.9 - 数据处理之字符编码和解码" E% U( }( s) Z
  3.10 - 数据处理之同义词替换
. L- Y( v* D6 B- Z  3.11 - 数据处理之提取文章中的第一张图片# a( N# ?) t1 s) z; i, f/ g8 G; c
  3.12 - 数据处理之空内容缺省值# }% Z/ [/ K0 x4 F' i7 N
  3.13 - 数据处理之内容前后缀
) I9 ]# h- g9 i& f  3.14 - 数据处理之随机插入' L) p7 I8 P9 w% \5 J+ c* X5 E
  3.15- 数据处理之OCR图片识别
) [/ }# t1 w) J7 V' k  3.16 - 数据处理之对单网址进行补全
" b7 I9 ?% {' L/ N0 I) v% M  3.17 - 数据处理之文件下载的设置方法, `( }2 B0 l/ N% E4 D0 y, D6 t0 @
  3.18 - 数据处理之内容过滤相关设置8 _/ A8 J# C/ g  t; z7 c. ]2 k
  3.19 - 自定义固定格式的数据
5 N& \9 O" [3 y$ \$ @  3.20- 如何循环采集一些数据8 q: [% V3 O2 j; Q
  3.21 - 如何采集网址中的数据
) X' \2 c! e$ P# ]: N# }& z  4.1 - Web在线发布到网址的设置方式
* Y3 }. a9 m( \2 [' F# l6 ^  4.2 - 将采集到的数据保存为本地TXT文件形式
- }4 {" l8 {% k5 Z' i; l  4.3 - 将采集到的数据保存为本地Word文件形式
' ]/ `* M5 `3 e3 @5 Z  K  4.4 - 将采集到的数据保存为本地Excel文件形式7 U/ p; X" v% `& i" q
  4.5- 将采集到的数据保存为本地Html文件形式- L6 y& B8 w/ J2 ]) q, J. T
  4.6 - 将采集到的数据保存为本地Csv文件形式
" e8 p/ q  H9 w. T" ^4 K  4.7 - 将采集到的数据导入到自定义数据库
. N4 t8 ^- G  W  4.8 - 发布数据完成之后可以对数据进行哪些操作
, j+ I( F# U! P$ U  4.9 - 如何控制每次发布的数据的条数; g$ H- _) [. Y9 D
  5.1 - 任务运行时线程设置的讲解/ M- ]' M! \8 z8 {
  5.2 - 文件下载设置的相关注意事项1 d# {' u, f. z
  5.3 - FTP同步文件上传如何设置( l9 J) }5 M9 `1 l
  5.4 - 如何给采集到的图片加上水印8 ~8 t2 r4 K5 E8 Y& }$ {* F
% S  w- a  Z% H" n3 y$ F
1.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|paopaomj.COM ( 渝ICP备18007172号|渝公网安备50010502503914号 )

GMT+8, 2024-12-4 01:09

Powered by paopaomj X3.5 © 2016-2025 sitemap

快速回复 返回顶部 返回列表