几款离线浏览软件非专业"评测"-

来源:百度文库 编辑:神马文学网 时间:2024/04/28 20:23:16
几款离线浏览软件非专业"评测"
一天的时间都磨在这几个软件上了,几乎一无所成。网上这方面的文章少得可怜,而且大部分文章不切实际。在此写一些体会,避免别人走冤枉路。 本来是为了实用的目的用的,不是为了评测,水平也有限,故仅供参考。
一、测试网站:
http://info.math.nankai.edu.cn/mathdoc/(南开大学的数学文档服务器,下面有很多书,基本上是pdf或rar,极少数不是,链接不超过三层)
http://eqworld.ipmnet.ru/ru/library/mathematics/(俄文的一个网上数学“图书馆”,提供俄文数学书籍下载,书不是很多,基本上是pdf或djvu,链接不超过两层)
http://nehudlit.ru/1/(俄文的另一个网上数学“图书馆”,提供英、俄文数学书籍下载,书比较多,基本上是rar格式,还有其他书籍)
(其实根本就不是用来测试的,本来我就是想下载上面的数学书!呜呼)
二、要求:
1.书籍下载完全; 而且过大的书籍不想下载。
2.为了保持原网站的结构,需要下载与书籍相关的网页,并要求软件自动更改已下载网页上的链接,但不需要无关网页;更不用说连到外部(其他网站)的链接了。
(这两点要求软件有强大的过滤功能和文件管理功能。)
3.速度快并要能断点续传
(离线浏览本来就是为窄带用户准备的,岂能不断点续传?!但是很多软件这里都有问题,详见下文)
三、用过的软件:
Webzip7. 0.1025;Teleport Pro1.42 ;WebCHM ;Offline explorer 4.5.2502(下简称OE);Website Extractor V9.52;还有一个a打头的,忘了叫什么名字。正经用过的只有前四个,后两个拿过来根本不会用,也就不打算再学了。
四、分项评测:
1.过滤功能
大类上有文件属性过滤、url过滤。其中最重要的是:链接层数过滤;文件类型过滤。此外文件大小、URL关键字过滤都很重要。
单凭链接层数显然是不行的,如果用于下载资源类的网站(比如我下载的这几个网站,简直就像ftp),加上文件类型过滤,还能凑合用;要是用于离线浏览网页居多的网站,那没人知道链接一共几层。各种软件在链接层数上的判断大同小异。另外除WebCHM外,都支持“仅下载当前目录下的文件”(如对http://nehudlit.ru/1,只能下载“http://nehudlit.ru/1/”子目录的文件。但是这个网站下的书籍,网址都在http://download.nehudlit.ru/域名下,此功能恰好派不上用场)
文件类型过滤,做得最好的是webzip,可以自定义各式各样的类,类下面再分扩展名;也预制了好几类文件类型(网页,图片,压缩包等等),随便选择。URL关键字过滤有正向过滤和反向过滤(正向指仅下载包含某关键字的文件,反向指不下载包含某关键字的文件),不错。可惜没有文件大小过滤。这在某些情况下造成很大的不便,比如窄带用户搜刮资源时,并不想下载太大的文件。
Teleport对文件属性有两种过滤方式:大于多少的不下载,或者精确地规定“仅下载同时符合下列某种扩展名和大小”的文件,如果选择了这个,就要一个一个输入,稍嫌麻烦。也有正向过滤和反向过滤。
OE对文件类型的过滤虽然可以自定义,但比webzip稍差一点,因为所有自定义的类型都挤在一个“用户自定义”类下面,不过预置了几类,一般情况下也够用了。而其url过滤异常强大,有协议过滤、文件名过滤、目录过滤、服务器过滤四类。
WebCHM对文件类型只有三种区分:“仅下载网页和图片”,“仅下载网页”和“下载所有内容”,不支持自定义文件类型。可见是针对网页居多的网站制作的,对资源型网站支持不力。而且不能过滤文件大小。对文件和图片的位置倒是可以大致过滤一下(“当前网站”,“当前域名”,“当前目录”),也很粗糙,而且没有关键字过滤。(未完)
2.多线程,下载速度,断点续传及稳定性
对离线浏览软件而言,下载速度和断点续传非常重要。下载速度主要依靠多线程来提高,WebZip支持16个线程,Teleport Pro支持10个,OE的上限没有试出来,几百个没问题,webchm似乎支持100个。下载速度以OE和webchm为最快,其次是teleport pro。
每个软件都号称支持断点续传,但他们大部分都是“伪断点续传”,即只支持项目的分次下载,不支持每个文件的断点续传。每次继续下载项目时,未完成的文件都要重新下载,而OE的“挂起到文件”也只是实现了项目的断点续传,和流传的说法不同。而这些只支持伪断点续传的软件在暂停时也要等到正在下载的文件下载完,非常不便。OE倒是不必等,而是中止所有正在下载的文件。这些软件中,只有webchm支持真正的断点续传。
3.文件管理:
Teleport Pro的下载目录就是工程文件的保存目录。
webzip和OE的文件管理功能都值得称赞,OE还有地图。但是OE不支持Unicode的非英文文件名。
各个软件都能很好地保持原网站的拓扑结构。
WEBZIP和OE有内置的网页浏览器。
4.软件特点及致命伤
webzip:能边下载边打包成ZIP文件。还有一个特点是能生成下载的速度-时间图,用途不大。速度稍慢,占用系统资源量稍大。暂停较慢,并且此过程极其不稳定,最好手动缩短自动保存项目的时间间隔。
OE:下载速度极快。缺点是不支持unicode的文件和目录名,会将其显示为一串数字、小写字母、横杠的混合体。这种情况下,如果想保持链接结构,必须让OE把连接转换成脱机的,此时网页上的链接文字(不仅是地址)也会重命名。不管是从本地浏览目录,还是浏览本地网页,都只能看到乱码。所以,不要用OE下载非英文目录名的网站!另外,占用系统资源较多。支持更新项目。
wEBCHM:能将下载下来的网页作成Chm文件(电子书)。支持Unicode文件名、目录名。速度极快。占用系统资源较少,有多种停止方式。缺点是过滤和文件管理稍差。可惜此软件已经不更新了……
Teleport Pro:占用系统资源很少。有易用的向导。但是不支持Unicode,速度又不如OE快。不过它不会将链接文字改名,因此本地的目录和文件名虽然乱码,但下载到的网页可以正常阅读。
建议:下载非英文目录名、文件名的网站,用Webchm;否则用OE。当然还有很多具体情况,比如经常更新的网站、文件很大的网站等等,可以具体分析,我也没有相关的经验,就不一一说明了。同样道理,这些软件的其他高级功能,比如“计划任务”等等,也请读者自己探索,本文只涉及特定情况(见文章开头)下的初级应用。
一面之辞,仅供参考。