站内搜索
编辑推荐
本类下载榜

软件简介
善肯网页TXT采集器是款专业小巧的网页文本采集工具。善肯网页TXT采集器可以帮助用户到一些网站的小说文章,通过专业的正则表达式筛选,去除掉不必要的内容,非常的简单实用。欢迎大家来jz5u体验!
1、规则设置:
①在规则设置窗口,在网站中随便找一篇文,不写任何规则,先点击实时预览,看看能不能获取网页源代码,能获取则再写规则,不能获取就没必要继续了。
②规则设置使用的是正则表达式匹配内容,有一定基础最好,没基础也可以参考给的范例,简单学习下,不需要深入学习正则。
③规则设置的时候,目录页和内容页需要分开预览,也就需要两个链接,一个目录页链接、一个内容页链接。
④关于替换,有通用替换和定制替换,这里目前不需要正则,普通替换就好,需要注意的是必须要输入值,空格也行。删除:选中整行,再按住delete键就行。内置\n再作为替换数据的时候代表换行。
⑤编码,目前只设置有GBK和UFT-8,差不多大多数网站就是这两种编码其中之一。
2、解析与
①解析请按解析地址2按钮,1按钮目前任性不想删,后面要开发其他功能,
②支持单章节和全文。
③支持添加章节数【有的小说没有章节数的时候就可以勾上】
④支持看,但是需要联网,此功能只是辅助,并非专业的看小说软件。
⑤进度和总需时间显示,内置多线程。
3、关于软件
①其实只要.exe就行,规则全是自己添加,commonrule.xml里面是通用替换规则。网站规则在rule文件夹下。我这边在里面放了两个网站的规则,主要是测试的时候是用的。其他网站规则,大家可以自己添加,或者支持开发者也行。
②软件没加壳,c#开发的,没放病毒。不放心请不要用,我不背锅。
③关于软件里面有个www.52pojie.cn跳转到论坛,我个人测试跳转的时候被360提示了,也有可能是因为跳转的是360浏览器,不知道你们会不会有这个问题。
④xml里面的内容,如果不清楚的话还是不要动它,免得软件识别失败报错。
都客网页抓手 v2.5绿色版[仿站必备工具]
刷网页访问量工具1.45绿色注册版_刷高博客和网站访问量
多任务网页刷新器v3.0绿色版_可定时刷新网页
网页爬虫工具[PClawer] V1.1绿色版_网页抓取工具
UUmeFLVSpy(Flash文件抓取器+播放器])1.0简体中文绿色版
网页源文件查看分析器v1.30绿色版_分析网页的HTML源代码
Editortools(无人值守自动采集助手)2.6.13绿色版
松鼠HTML编辑器(纯代码式的HTML编辑器) 绿色版
CYY网页提取助手v2.9绿色版_从网页提取图片Flash动画等
IETester (IE浏览器兼容性测试) 0.5.4 纯净安装版
网站地图生成工具_小爬虫2.0简体中文版
火车采集器v3.2 SP5 VIP版特别文件
web表单编辑器CoffeeCup Flash Form Builder V7.2绿色特别版
石青伪原创工具 2.3.9.11 绿色免费版
HTML to EXE Converter(将HTML转为EXE文件)v1.0英文绿色版
网页媒体探测器v1.0绿色版(探测出网页上的媒体文件)