运用getproxylist与proxyleech联合实现代理海量吸附——实践谈[不加密]

来源:百度文库 编辑:神马文学网 时间:2024/04/28 19:41:07

[0917][原创]运用getproxylist与proxyleech联合实现代理海量吸附——实践谈[不加密]

发布时间:2005-09-17 05:06  文章来源:http://www.ifstar.net/bbs  浏览次数:4611  468*60广告位招租 -0917时有如下的文章:
http://www.ifstar.net/bbs/read.php?tid=73398&fpage=1
非常粗略地谈了当前的代理海量吸附的状况。可是所极力推荐大家使用的PROXY LEECH与GetProxyList两款小巧的代理吸咐工具的实践指导还缺乏。于是写这个实践篇,为新手朋友更好掌握这种方法。

这个方法是独创的。希望一部分人转贴时,注明星荧原创,这是一种美德,同时也宣传星荧。

1.所需工具:
(1)MAGICFILTER、EXCEL得代理吸附列表整理工具;
(2)PROXY LEECH与GetProxyList代理吸附工具;
二个软件在上文中曾经作过简略的比较。摘过来:
前者是根据APL改版的,吸附力超强,对超量的验证有时会发生OVER RUN软件中止运行现象,而且会频频跳出存放网页COOKIE要求,无效的网页会对其运行速度有一定影响,但其小巧对于小于500条的PROXYLIST可以跑动,同时在验证完成它的窗口会显示每一条链接,吸取了几个代理,我们也可以 据此来清理无效的地址。GETPROXYLIST较前者运行更稳定。速度飞快!!!正因为速度太快了,我都懒于清除无效的链接。

另外要补充:二者吸附同一批代理列表的能力,前者是后者的一倍,甚至可达数倍。但吸附的代理并不是前者包含了后者,而是互有交叉。这就是二者联合应用的基础,如此可以更加充分地榨取代理吸附列表。

(3)小木虫的ProxyJusticer或用MAGICFILTER\ZLEECHER等代理的整理工具;
目的用它们来去重复,去除不则的代理。当然用前者更方便同时实现代理的定位,感谢小木虫。

2.实践:
(1)我们以星荧benjazz兄弟的贴子为例先行代理吸附列表的整理:
http://www.ifstar.net/bbs/read.php?tid=72837&fpage=1
1)首先挎贝入TXT文本,保存;
2)整理:
      用MAGICFILTER过滤去重,(benjazz兄弟,太大意了,有很多重复)。(当然其他的工具:DelDoubleLine或ZLEECHER也可以实现去重。)
      再看看是否都是标准的HTTP://格式,如果有不是的,一定要用EXCEL工具给批量加上。这点很重要。所幸的是这个贴了里基本还是标准的格式。
      对整理后的分成数份文本,每个文本有N个URLS(我的机器用500条正好,你的机器如何,网络如何,要自已探索)
以下为方便说明,我取整理的最前方的一百个为例:
http://1123.myrice.com/mianfei/30dl01.htm
http://1123.myrice.com/mianfei/533Proxys.txt
http://195.208.219.11/proxies.htm
http://1key.myrice.com/proxy.htm
http://202.102.12.155/tv/proxy/
http://202.127.203.201/~zxh/physics.html
http://202.98.223.106/music/proxy.php
http://210.29.176.101/xywl/dl.asp
http://210.64.24.31/maillist/file/pisa/20031129014425.html
http://2828.ru/lnk/proxy.htm
http://2ch.net/kitanet/kitchen2/kako/967/967697973.html
http://2ch.net/kitanet/kitchen2/kako/969/969545211.html
http://2pik.com/view_date/1043960400.html
http://30_282_ylxiezhen_y.web.cn2x.com/
http://4_1632_gamecs_y.web.cn2x.com/
http://4inlove.ru/Anonymous-proxies-.htm
http://4inlove.ru/anonymous-proxy.htm
http://4inlove.ru/multiproxy-proxy-list.htm
http://4inlove.ru/proxy-8000.htm
http://51zz.com/bbs/bbs/viewthread.php?tid=35&sid=nXs9SmZc
http://5jereh.persianblog.com/
http://5u.51.net/lesson/proxy/proxy1.htm
http://64.246.42.111/proxy/
http://8012.teacup.com/multisuki/bbs
http://8u8.com/dxhdr/p.htm
http://8u8.com/gofast/00wuben.txt
http://8u8.com/icame/b.htm
http://9moon.8u8.com/free/freedl.htm
http://aaabill.8u8.com/QQ.htm
http://abu8.8m.com/proxys1.html
http://ad.my-fussel.de/webclicker/proxyy.txt
http://adamxc.myrice.com/
http://agat.net.ru/many/proxy.txt
http://agressor.times.lv/hacking/au.html
http://agressor.times.lv/hacking/com.html
http://agressor.times.lv/hacking/de.html
http://agressor.times.lv/hacking/hvzip.html
http://ahui.okey.net/~ahui/169cg-setup2.htm
http://air-ug.obi.ne.jp/net/biginner/kusi.html
http://akmos.by.ru/proxylist.shtm
http://al-hammadi.8m.com/al_hammadi4.htm
http://allproxies.com/page1.html
http://almlk1.tripod.com/brooksi.htm
http://altnet.ru/~hackfaq/archive/proxy/p1.htm
http://altnet.ru/~hackfaq/archive/proxy/p10.htm
http://altnet.ru/~hackfaq/archive/proxy/p2.htm
http://altnet.ru/~hackfaq/archive/proxy/p3.htm
http://altnet.ru/~hackfaq/archive/proxy/p4.htm
http://altnet.ru/~hackfaq/archive/proxy/p5.htm
http://altnet.ru/~hackfaq/archive/proxy/p6.htm
http://altnet.ru/~hackfaq/archive/proxy/p7.htm
http://altnet.ru/~hackfaq/archive/proxy/p8.htm
http://altnet.ru/~hackfaq/archive/proxy/p9.htm
http://altnet.ru/~shpege/?page=xinfo&st=proxy
http://alwafaei.9f.com/proxy.htm
http://amigaworld.net/modules/features/index.php?op=r&cat_id=4&rev_id=28&sort_by
http://andreyhr1974dy.front.ru/prom/grubby.html
http://angelfire.com/ab6/black/trojan/proxy.htm
http://angelfire.com/ar3/teru/proxy.html
http://angelfire.com/darkside/newzmongerz/proxy01.html
http://angelfire.com/empire/lupusinfabula/ProxyLISTOK.htm
http://angelfire.com/folk/korduncafe/proxy.html
http://angelfire.com/pe2/total4/files/proxies17.txt
http://angelfire.com/realm/asa/proxie.html
http://angelfire.com/sc2/hapyslapper/proxies.txt
http://angelfire.com/wy/0waynes/0proxies.html
http://anonymity.tuxfamily.org/pages/english/proxy_list.htm
http://antihack.by.ru/servis/proxy.html
http://anty123.persianblog.com/
http://anzwers.org/free/bymor/proxylist.htm
http://arasiok.tripod.co.jp/proxy.htm
http://arch.pcgames.com.cn/games/netgames/gong/other/10308/200718_1.html
http://archbosk-12.org/free-socks-proxy-list.html
http://archbosk-12.org/socks-proxy-list.html
http://archiwa.host.sk/proxy/dawnload/proxy05092003.txt
http://argon.pu.acad.bg/ksx/links/proxy_.htm
http://art.aees.kyushu-u.ac.jp/members/ikeuchi/soushu.htm
http://asian18x.abbilling.com/partera/proxy1.html
http://asp.6to23.com/ymj/bbs/bbsjttz.asp?tzid=1231
http://asp.flaaten.dk/proxo/post.asp?method=TopicQuote&TOPIC_ID=1747&FORUM_ID=2
http://assorty.narod.ru/proxy/proxy.htm
http://atfyg.myrice.com/index2.htm
http://atomintersoft.com/products/alive-
http://atomintersoft.com/products/alive-p
http://atomintersoft.com/products/alive-proxy/
http://atomintersoft.com/products/alive-proxy/p
http://atomintersoft.com/products/alive-proxy/pr
http://atomintersoft.com/products/alive-proxy/proxy-list/
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=1
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=10
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=11
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=12
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=13
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=14
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=15
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=16
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=17
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=18
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=19
http://atomintersoft.com/products/alive-proxy/proxy-list/?ap=2

3.用GETPROXYLIST吸附:
(1)把上述代理吸附列表拷入GETPROXYLIST目录下的PROXYSITES,另外建立以任意名如PROXIES文本文件,作为输出地址
(2)打开GETPROXYLIST软件,在第一栏的BROWSE中定位到PROXYSITES.TXT,第二栏的BROWSE中定位到PROXIES.TXT
(3)点击DOWNLOAD PROXY WEB PAGES NOW!
(4)等待最下方出现DOWNLOAD SUCCESSFULLY FINISHED!说明完成吸附。
(5)点击PROXY LIST TO DESTINATION保存代理。再去PROXIES.TXT中找到你所吸附的代理吧!
注:软件吸过程中,在GETPROXYLIST目录下会出现许多TEST文本文件,这是缓存形式,不要理会,吸附完成,其会自动消失的。
这里面有许多不规则的代理形式,初步试用PROXYJUSTICER批注,显示有1661条规则代理。

4.用PROXYLEECH吸附:
(1)把上述代理吸附列表拷入PROXYLEECH目录下的SITES中,
(2)打开PROXYLEECH软件:BOTS运行设为20,线程不宜太大否则易死,点击GO。
(3)如果贴子里无效吸附列表多,则运行减慢就明显。当代理吸附列表的吸附完成,没CHECKING显示时,点击SAVE。一定要看到PROXYLEECH目录下的PROXIES有代理时,才可放心关闭软件。
这里面同样有许多不规则的代理形式,初步试用PROXYJUSTICER批注,显示有2572条规则代理。

5.将3与4的代理结果合并后,用PROXYJUSTICER批注,显示有2599条规则代理。保存。

6.将上述的2599条导入代理猎手,点击类型,清除TELNET、FTP等不需要的类型。此例只保留HTTP类型的,还余2561个。
应用YAHOO验证:
207.248.240.119:80@HTTP$6&297,797,813#墨西哥 Unknown
148.244.150.57:80@HTTP$6&312,781,781#墨西哥 Unknown
218.188.8.182:80@HTTP$6&1093,1172,1312#[C]香港 大学
200.242.249.70:80@HTTP$6&781,2922,2922#巴西 圣保罗
210.0.209.47:80@HTTP$6&3031,3500,3500#香港 特别行政区
148.244.150.58:80@HTTP$6&3125,4157,4438#墨西哥 Unknown
213.97.196.205:80@HTTP$6&1219,6094,6094#西班牙 Unknown
80.24.86.247:80@HTTP$6&4000,15156,15156#法国 巴黎
80.26.113.195:80@HTTP$6&9453,15594,15594#西班牙 Unknown

仅有可怜的9枚是FREE的!!!只有巴西的那一枚是通过了SD验证。
你失望了吗?事实上就是这样,活的代理是从海量中百里挑一的残存!我前段时间练代理吸附时,平均用1000条吸附列表才能达到吸附500至1000活代理。

7.千万别失望啊!看看我的建议:
(1)我曾将三个知名的代理论坛的代理列表的部分随意收集在一个文本里,而后如前整理,分成以500个URLS为一个单位的文本,总计达15个之多,因为已去重,这15个代理吸附列表是完全不同!!!我每天以2-3个文本,即以1000-1500个URLS来实现海量吸附,验证。一般可有500-1000活代理入帐。
(2)可以在应用PORXYLEECH验证吸附时,顺手清除无效的链接,保留有效的。从而进一步构建精品的代理列表,这样下次,同样用100个URLS就绝不只会少得只有不到3000代理的现象。
(3)获取精品的代理吸附列表,除上法外,也可以采用手工收集的方法。也可采用知名论坛里,高手的近期吸附列表。

实现海量吸附,别忘记顺手验证一下有无文献代理。它们一般都是老代理。

最后祝大家中秋节快乐!

更多资源,及详细信息,请点击这里,访问星荧论坛