设为主页 加入收藏 繁體中文

广告站,发布站URL链接采集器发布

9999999.png

马风窝专业URL提取器V1.0说明书

广告站,发布站点链接采集用

打造最简单,最易用的的SEO软件

www.digurl.net   QQ:3311357582

 www.digshell.net QQ:1824589132

跳过域名

有些网站去扫描没有任何意义,浪费扫描时间,所以可以用此项过滤跳过域名中输入了baidu.com 即可过滤1.baidu.com 2.baidu.com任何这个后缀延伸一下,输入.com .net .cn等网址的话,可以把中国的网站全部过滤了

允许长度

有时候提取过程中会出现一些垃圾网址,我们需要用长度来规范,5-35的意思就是,长度大于5个字符,但是小于35个字符的网址,就允许提取到结果框里面

导入多个(企业版用户)

就是允许一次性导入多个网址来分析(企业版用户)

采集深度

大部分广告站点页面,都是采用了跳转链接或者JS跳转来间接显示,如果直接查看源码是无法提取到的,所以需要多次跳转跟踪,采集深度1就是表示只采集当前页面,不跟踪,采集深度2就表示跟踪一次,采集深度3就跟踪两次,以此类推,如果采集深度10的话,就可能采集到大量相关行业的网址,当然这其中也肯定会出现偏离行业的情况,因为一个网站中的链接可能还会有一些其他行业的友情链接的情况,但是获取同行业网址的概率大大增加,因为发布站中可能还有其他发布站,这样就会被爬行进来采集,适合需要更多同行业网址的客户。

JS正则

很多发布式网页是采用JS跳转,甚至多级JS跳转,这个时候需要对网页中的JS文件进行分析才能准确提取

正则一

用来提取页面链接的关键代码,因各种网页环境复杂,所以采用多条正则叠加来判断各种页面

叠加正则二

提取页面第二个采集方案,会适应更多的网页范围,当上个正则获取不到的时候可以启用本正则尝试

叠加正则三

提取页面第三个采集方案,会适应更多的网页范围,当上个正则获取不到的时候可以启用本正则尝试

叠加正则四

提取页面第四个采集方案,会适应更多的网页范围,当上个正则获取不到的时候可以启用本正则尝试

 

 

 

 

 

 

版本区别

功能

个人版

企业版

试用版

导入多个

 

 

试用版一次可以使用30分钟,使用次数随机,具有企业版本全部功能,但没有导出功能,只能在结果框查看

 

采集深度

2

10

JS分析

可用正则数量

1

4

导出只保留主域名

 



TAG:

在线客服

售前客服一号
点击这里给我发消息
售前客服二号
点击这里给我发消息
售后客服一号
点击这里给我发消息
售后客服二号
点击这里给我发消息