警惕数字冰河时代来临 科技频道科技创造财富

来源:百度文库 编辑:神马文学网 时间:2024/04/25 07:58:03
警惕数字冰河时代来临
2007-02-17 09:42:59 来源:网易科技报道网友评论 65 条进入论坛
“0”和“1”记录了我们时代的一切,如果有一天技术改变了,所有的电子文档都被冰封了,人类的一段历史是否会因为这样而丢失?
“0”和“1”记录了我们时代的一切,比特和字节构成了一个虚拟的社会。但是如果,如果有一天技术改变了,所有的电子文档都被冰封了——因我们已经遗忘了如何去解读文档。那种文档的格式已消失在历史的长河中,人类的一段历史是否会因为这样而丢失?
(图1:人们发现昨天记录在电脑上的照片、文档等今天已经不能访问了,这一切仅仅是因为文件格式的改变)当航母遭遇化
美国核动力航空母舰“尼米兹”号驶入了茫茫大海,它携带了超过50万份的文档,这些文档包括各种推进器、电力系统图表以及其他与操作有关的系统图表。21世纪出航的尼米兹已经用不着携带纸质的工程图,所有的一切都被用二进制记录在电脑中。数字时代的来临,让海军工程师不用亲临尼米兹号就能存取这些图表,航母的保养维护也就更加高效。
但几年前,海军已经注意到,当用新版本的计算机辅助设计(CAD)软件打开旧的文件时,在理论上可能会出现问题。诺福克(美国主要的海军基地)海军造船厂舰艇分队的航母编队的头儿布瑞克说:“我们可能在打开这些图表时,发现它们已经没有从前那样精确了。”
对于海军工程师来说,细微的变化同样让人异常头痛,无论是点线被译成了破折号还是改变了很小的尺度。甚至丝毫的差异都能让航母的动力系统出现问题。
重新解码而得到的文件因为产生了误差,对于美国海军来说这些资料已经失去了其本来的作用。事实上在今天,每个人都面临着同样的问题。我们已经习惯与将资料保存成数字的形式,我们依赖这些数字化的文件,并理所应当地认为它们现在、将来都是可靠的。但实际上,我们所有的数字资料,从爱人的照片到海军的舰艇图表,都冒着变得不可读取或者丢失的危险。
对于普通的用户来说,存在的问题有的已经显现,有的仍然潜伏着。当我们的损坏、新购置的电脑没有软驱,或是邮件服务商破产并且用户的信件也随之消失了,这些情况都会失去数据。当灾难发生时,这些类型的数据更加可能遗失。数据量越大,意味着承受丢失的风险也越大。如果现在用的软硬件不能保证所存储的数据毫无丢失的风险可言,那么我们所使用的资料可能会不复存在。
鉴于这些可能出现的问题,各国政府和研究机构几年前就已经着手寻求解决方案,但是目前还鲜有成就。这一领域的专家称,如果我们不能在短时间内找到解决的办法,我们的历史很可能出现空白,对人们的生存都可能产生影响。正如兰德公司(Rand Corp.)的数字存储专家杰夫所说:“这一时期大量的资料将会丢失”。
将照片、信件以及其他的文件藏匿在安全的地方,保存信息以供子孙参阅,这一行为贯穿了整个人类的历史。今天,我们仍然可以读到美国内战中人们冒着生命危险保存下来的信件,但是100年后,我们的子孙还能否读到我们今日的军中家书?从伊拉克前线寄回的数百万封电子邮件能在1个世纪后被人们解读吗?
文件的存档变得越来越复杂,我们不仅要将数据保存在、磁带、硬盘上,更为重要的是我们要确保这些数据在未来能被还原。杰夫说道:“很多人并没有意识到这些数字材料解码后必须是元件的真实反映,软件应该知道如何补充数据,并能够在电脑上运行。”
例如在1986年,英国广播公司编译了一个现代版本的“末日审判书”,(末日审判书,英文名Domesday Book,是1086年完成的大规模调查英格兰的记录,由征服者威廉实施,类似于现在政府的人口普查。)超过一百万的人为这本新“书”提交了照片,描述性文字以及视频资料。考虑到这份资料应当永久保存下去,它被存储在光盘中,以便后人能了解20世纪人们的生活情况。
但是仅仅过了15年,英国官方就发现这些光盘资料已经不可能流传百世了,不仅是因为光盘被腐蚀,而且它已经和现代的电脑系统不兼容了。与此相反的是,1086年的“末日审判书”仍然存放在位于克佑区的英国国家档案馆供人们阅读。(现代版本的媒体资料却需要被抢救。)
电脑技术标准的改变并不是数字资料唯一的威胁。在2004年,迈阿密的戴得县宣布其丢失了2002年大选几乎所有的电子选票记录,这一切都源于一系列的电脑崩溃。这个案例再次提醒我们数字化记录并不可靠。存储设备必需状态良好,不能丢失数据。加之软件公司的倒闭,人们的资料也随之消逝。在2001年,在线的相册网站PhotoPoin关闭了其站点,导致数百人丢失了存储在的照片。
数据的丢失不总是表现为硬盘的损毁或是光盘没有相应的设备来读取。数字化的文件是由一长串的二进制码组成,它跟文字信息或是图片信息立即能被人们读取不一样,它需要用相应的软件正确的解码或者说翻译成人们能看懂的信息。
根据软件和讯息产业协会的统计,应用软件平均每18个月至两年就会升级换代,并且新版本的软件并不总能与旧的格式兼容。这样的趋势对于尼米兹号是一个不小的麻烦,当你因软件升级而打不开你的病例记录时,麻烦同样找上了你。
同样的,律师事务所面临数字时代的大问题。原始数据的某些因素变得不确定,比如当文件被复制时不能准确地显示原件的创建时间。例如,像硬盘这类的磁性存储介质,允许有三个文件有关的时间(创建、访问、修改),而像CD-R这种光盘存储器则只有一个文件相关的时间。在诉讼中,律师需要建立关键事件的时间表时,数字资料时间的不确定性制造了很多困难。电脑诉讼专家鲍尔.克雷格劝告律师事务所说:“我见过许多类似很简单的案子,但是在很多层面上却有相当复杂的问题存在,结果输掉了不少官司。”
正如美国档案学会的理查德提出的,我们能够保存数字“0”、“1”到永久,但是我们能真正了解它们吗?
国家档案馆的问题
最近,华盛顿国家档案馆电子档案部的主管的斯波德奥.肯在一次会谈中说道,国家档案馆对保存历史文档这项工作感到沮丧。这些文档包括所有历史相关的文件,和联邦政府签发的材料,内容覆盖了从白宫的电子邮件到核废料的掩埋地点。10年前,斯波德奥主要考虑如何将克林顿政府产生的3200万封电子邮件记入档案。但这仅仅是一个开始,布什主导的白宫预计会在2008年产生1亿封电子邮件。斯波德奥很早就意识到用传统的方法将数据复制到磁带中,在数字时代是不可行的。用传统的方法需要花费数年去完成,而且所能完成的任务跟源源到来的海量数据相比,犹如细流与雪崩。
斯波德奥说,无处不在的电脑正是问题所在,无论是修建高速、挖掘隧道、造船还是生产飞机,所有的设计都是利用电脑来完成。电子档案的归档比纸质文件要快100倍,但我们不知道如何防止数据丢失,做到万无一失。
美国国家档案馆希望这些海量的数据在将来也是易于解读的。斯波德奥期望一个全新的系统能够帮助他实现愿望。无论文件是采用何种平台、软件创建,或是任何一种媒体格式作为载体,斯波德奥期望文件都能被正确的解读,而且希望这种系统能够一劳永逸的使用下去。为此他拜访了政府研究所的人员,但回答是否定的——这个问题是如此的复杂,工程非常艰巨,难以想象可以解决它。
去年,美国国家档案馆同洛克希德-马丁(Lockheed Martin)公司签订了价值3.08亿美元的合同,希望后者能开发可靠的系统。该项目的负责人克莱德认为这是信息时代一个开创性的事件。
电子档案馆每天面对超过4500份需要统计的文件,工作人员需要细分文件,哪些是需要单独处理?哪些需要被保存?
当我们发电子邮件给管理机构时,如果邮件只是纯粹的文本,管理者可以立刻读到内容并进行相应的处理。但假设邮件有附件,比如电子表格,那么就需要管理者的电脑上也有相应能打开电子表格的软件,否则附件就是废纸了。换句话说,下一代人必须具备解读各种格式数据的能力。
解读更加复杂的文件格式带来巨大的挑战,它所产生的困难远甚于纸质文档所带来的任何问题。
比如美国航空航天局的虚拟训练程序就需要更加复杂的解决方案。美国电子档案馆已经开始同多家科研机构合作迎接挑战,包括美国圣地亚哥超级计算中心和美国国家科学基金。
洛克希德公司打算创建一套“移动(migration)”系统,这套系统可以将任何文件灵活地转换成易读取的格式,比如可扩展标记语言(XML)格式。在未来无论技术如何改变,这些文件依旧可以被解读。
并非每个人都同意洛克希德公司的方案。兰德公司的Rothenberg认为“仿真”策略是更加适宜的解决方案。仿真能够使现代的计算机模拟成老式的机子,因此某些程序就可以在上面运行。现在流行的仿真程序使得人们可以借助索尼的PlayStation 2或是微软的Xbox,在个人电脑上运行视频游戏。
Rothenberg认为“移动”系统方案没有致力于挽救原始文件,违背了初衷。任何方案最重要的一点是保持原始文件的完整性。
洛克希德公司的克莱德驳斥说,从费用以及技术水平上来讲,仿真并不适用于像电子档案馆这样的大型工程。他进一步指出,档案馆的很多资料是可以供任何一个读者检索阅读的,而仿真则大大提供了阅读的门槛。仿真不得不统计成千上万的用户当前使用的软、硬件
洛克希德公司最初计划在2007年9月拿出可行的系统雏形,但是预算削减使得进展缓慢,可能导致产品推迟发布。
国家档案馆和军方在加紧研究保存数据的方法,他们希望拔得头筹,此外美国国会图书馆同样致力于自己的保存计划,很多高校科研机构也加入到这一行列,不甘人后。
但这些研究计划主要是针对政府以及学术机构,并不针对个人用户,换句话说用户丢失的电子邮件依然无法找回。一些专家说这是市场定律决定的:个人用户对数据保存技术并不那么热心,而公司要适应顾客的需要才能生存下去。因此并没有出现针对个人用户的相关研究计划。还有一些人认为公司仅仅关心的是多卖出一些新的产品,追求利润。
Rothenberg说公司的兴趣集中在制造不兼容性而非兼容性,他指出,兼容性带给公司的只有客户升级换代次数减少,因此公司往往不会承担兼容问题的重担。
不过,也有公司鼓励发展,在2005年底,微软宣布其开放Office软件的部分源代码,包括Word和Excel。微软的这一举动是希望Office成为一种国际性标准格式,通过向第三方的开发者提供源代码,微软的软件格式很可能成为一种通用标准,可以被下一代继续使用。
同时Adobe公司在PDF格式基础上改进的一种版本得到了国际标准化组织的鉴定。这种格式被称为PDF/A。改进后的PDF/A是为长期存档量身打造的,它可以保存文档中除一些特定内容外的一切,这些不被保存的内容通常都是在短时间内是有用的,但是时间长了就会失去原来的作用。比如,文档中连接外部应用程序的部分就不会被保存,因为这些外部程序随着时间推移很可能被淘汰掉;PDF/A也不允许设置密码,因为密码可能会遗忘丢失。Adobe的全球标准部门主任Melonie Warfel参与了PDF/A的开发,他说这是一个可以长远流传下去的可靠系统。Adobe同时还进行针对工程文档和数字图形档案的标准化研究。
历史的启迪
我们记录下历史,因为历史可以给予我们启迪,但是我们想象不到未来人们会采取何种方式解读我们记录下的这些数字信息。关键是数据也要保持活力,而不是被时间抛弃在身后。
Warfel最后说到,“重要的记录”将来不仅是针对国家大事,每个人觉得重要的都会被记录并永久保存下去。她说:“我的母亲有一大箱子的老照片,而我则有装满整个硬盘的照片,这些都将永久流传下去。”
保存你的数据
下面不是什么神奇的机器可以让你永久保存数据,只是一些简单却能帮上你的小策略。
使用超强的备份(图2)将你电脑上所有的东西都自动备份到一个大容量的硬盘中,现在1TB容量的硬盘比比皆是。这样即使你电脑上的数据丢失,你还拥有备份下来的数据。如果这样还觉得不够的话,可以将你的数据上传一份到在线硬盘中,在线硬盘提供商也不少,这也不失为一个好的选择。
用黄金制作光盘(图3)刻录的CD或是DVD在三年后就可能开始磨损严重,导致数据丢失。现在美国的柯达公司和Memorex公司提供制作黄金光盘的业务,这种盘是用24k黄金制成,采用氧化的技术录制数据,可以至少保存300年。这种盘防止由于光盘磨损而丢失数据,同时还与现代的计算机兼容。
恢复你的数据
Ontrack数据恢复公司提供数据还原业务,可以从损坏的硬盘中恢复出数据。MediaRecover公司和eImage Recovery 公司则提供恢复数码相机数据的业务,可以帮助用户恢复那些以外删除的照片。
将数据打印出来
目前很多版本的软件都是公司私有的,这意味这软件提供商一旦破产,就可能不再提供软件给用户使用。所以建议大家把重要的文件都打印出来,这虽然麻烦,但是总比数据丢失后悔莫及来得强吧。再次记住,随时备份文件绝对是个明智的选择。(网易科技 pluto)
警惕数字冰河时代来临 科技频道科技创造财富 警惕数字冰河时代来临 人工智能新项目web3.0 下一个即将到来的时代科技频道科技创造财富 第四位 成吉思汗科技频道科技创造财富 百度工程师:算法是百度利器科技频道科技创造财富 Google总部员工腐败生活(最新)科技频道科技创造财富 Google第一美女的工作流程科技频道科技创造财富 商业周刊:诺基亚联合西门子 直指中国市场科技频道科技创造财富 Del.icio.us的成功经验科技频道科技创造财富 Google Earth的十个常用技巧应用科技频道科技创造财富 看稀奇:六款非主流在线聊天工具科技频道科技创造财富 JSP编程进度条设计实例科技频道科技创造财富 Win基础:DOS操作系统·科技频道·科技创造财富 Cool 3d 3.5视频教程·科技频道·科技创造财富 Cool 3d 3.5视频教程·科技频道·科技创造财富 让Windows自动化安装2·科技频道·科技创造财富 让Windows自动化安装3·科技频道·科技创造财富 让Windows自动化安装4·科技频道·科技创造财富 警惕!“笨蛋时代”来临 警惕!“笨蛋时代”来临 小冰河时代来临,东北人的冬天更难熬了 大学生找工作的十种web2.0方式科技频道科技创造财富 Google 6天旅程之技术与商业科技频道科技创造财富 "软件即服务"从小众技术向具有破坏力的技术转变科技频道科技创造财富