站内搜索
编辑推荐
本类下载榜
软件简介
网页信息收集器是一款功能实用绿色小巧的网页信息采集软件。网页信息收集器可以很方便的针对某个网站的信息内容进行收集。需要的快来下载网页信息收集器使用吧!
1、执行任务
根据已建立的任务信息保存、提取网页,也可通过双击某项任务启动此功能
2、新建、复制、修改、删除任务
新建、复制、修改、删除任务信息
3、默认选项
设置默认工作路径(默认为当前程序目录下的WorkDir文件夹)
设置默认提取测试数 (默认为10)
设置默认文本分隔符 (默认为 *)
4、新建、编辑任务信息
任务名称:在默认的工作文件夹下生成以此命名的文件夹。
登录地址:针对某些需要登录才能查看其网页内容的网站,填写登录页面地址。在执行任务时,软件会打开此登录页面让您登录该网站
序数格式类型网页、非序数格式类型网:
这里的序数格式、非序数格式主要是指提取地址是否仅仅是数字的变化。例如类似于:
①http://xxx.com/1.html 和 http://xxx.com/2.html 就属于序数格式
②http://xxx.com/abc.html 和 http://xxx.com/def.html 则属于非序数格式
列表地址:在类型为非序数格式类型网时,第一页列表的链接地址
提取地址:由实际保存的网页地址共同部分 + * 号组成。
例如要提取:
①http://xxx.com/1.html 和 http://xxx.com/2.html 则提取地址为 http://xxx.com/*.html
②http://abc.xxx.com/abc.html 和 http://test.xxx.com/def.html 则提取地址为 http://*.xxx.com/*.html
翻页地址:为列表网页上的下一页链接地址,将其中变化的部分用 * 号代替。
页数起始:要开始提取的页数
页数截止:要停止提取的页数
当前页数:当前已经提取到的页数
已保存网页数:已经保存的网页数
任务详细描述:该任务的详细描述信息
都客网页抓手 v2.5绿色版[仿站必备工具]
刷网页访问量工具1.45绿色注册版_刷高博客和网站访问量
多任务网页刷新器v3.0绿色版_可定时刷新网页
网页爬虫工具[PClawer] V1.1绿色版_网页抓取工具
UUmeFLVSpy(Flash文件抓取器+播放器])1.0简体中文绿色版
网页源文件查看分析器v1.30绿色版_分析网页的HTML源代码
Editortools(无人值守自动采集助手)2.6.13绿色版
松鼠HTML编辑器(纯代码式的HTML编辑器) 绿色版
CYY网页提取助手v2.9绿色版_从网页提取图片Flash动画等
IETester (IE浏览器兼容性测试) 0.5.4 纯净安装版
网站地图生成工具_小爬虫2.0简体中文版
火车采集器v3.2 SP5 VIP版特别文件
web表单编辑器CoffeeCup Flash Form Builder V7.2绿色特别版
石青伪原创工具 2.3.9.11 绿色免费版
HTML to EXE Converter(将HTML转为EXE文件)v1.0英文绿色版
网页媒体探测器v1.0绿色版(探测出网页上的媒体文件)