一千年以后,考古学家怎样刷你的朋友圈?

编辑: 04 / 11 / 2015 3,587 次围观

如今,我们已进入信息爆炸的年代。1000年后的人类要如何读取现在的信息,了解我们的生活呢?刘慈欣说,保存信息最长久的方式就是刻在石头上,而现在,一家美国公司正在尝试把信息刻在金属上,以便能永久保存。

1000年后,一名年轻女孩信步走过废弃荒凉的纽约城。社会已经崩塌。她径直来到了纽约公共图书馆残骸的地下室。推开沉重的大门,她发现了一堆堆的硬盘。这里曾存储着关于整个世界的知识,以及如何让事物轻易运转的重要信息——比如说,如何制药,内燃机的工作原理,以及如何犁地,诸如此类。但是,这些硬盘早已坏掉,她找不到可以读取这些信息的方法。

122

这个场景,绝对是档案管理员和数据保护主义者最希望避免的局面,因为人类长期累积起来的知识都将失落。现在,有一种储存数字信息的新方法,也许能让我们的后代比我们更好地了解自己的祖先。

直到21世纪,图书馆都还在以纸质书籍的形式保存知识。但是现在,人类正用计算机创造着大量的数据,每年创造的数据甚至超过了2003年以前整个地球上所有信息的总和。因此,我们储存和保存数据的方式必须发生变革。随着时间的推移,硬盘会损坏,网页会消失。如果一家公司倒闭,它存储的有价值的数据也将逐渐消逝。这还是建立在我们知道如何打开老旧格式的基础上。

Group 47是一家位于美国加州伍德兰希尔斯的公司,他们就正在为我们的硬盘和光盘的短暂寿命寻找解决方法。在写下「1」和「0」的数据时,他们并不是采用磁信号,而是采用一种叫做「DOTS」的系统,用激光将微小的点写在金属卷带上。卷带会用暗盒来存储。用一台高分辨率的数码相机就能读取其中的数据。未来的人类想要读取这些信息,只需要懂得二进制的知识,再加上一台显微镜就可以了。这家公司说,金属卷带在几百年的时间内都不会腐蚀。更重要的是,它们不需要像纸质书籍一样,用严格控制的特殊环境来储存。

去年,这家公司从一家美国情报机构处获得了投资,以开发出原型,目前正在募集资金以开发商业化的版本。使用这种媒介来读取内含的1.2TB数据,不需要懂任何关于硬件和计算机的知识。Group 47的总裁Rob Hummel说:「它很像旅行者号探测器上搭载的金唱盘」。

Hummel认为他看到了对这种可以无限持续的离线存储的需求。比如,他接触的政府机构想要备份包含在40个足球场大小的中央数据中心的数据。他说:「他们想要永久的保存它——事实上他们并不是说要永远,而是在国家存在的年月里。」

不只是政府机构想要把事情永久地记录下来。未来的历史学家也需要一种方法来获取过去15年来发生的不可思议的信息爆炸。Ian Milligan是加拿大滑铁卢大学的数字历史学家,他认为数字记录,比如来自于网站大爆发时期的网页和个人博客给了历史学家一种洞察正常人生活的方式。他说:「从1996年开始,我们收集了几十亿的数字对象,记录了人们每天的生活,他们的所思所想,所爱所惧。」

这意味着,找到某种方式来存储我们的历史并能对其进行搜索,是非常重要的。但这样的规模让人气馁,并且超出了网页的范围。非盈利组织Internet Archive的Jason Scott说:「我们在收集数量巨大的人类信息。手机、书写、无处不在且持续拍摄的照片。」

新历史

即使那些公司存储工作数据让人没啥兴趣——邮件、数据库、人力资源记录等等——有一天可能都会被那些想要了解21世纪早期的历史学家视为珍宝。

如果未来的人类无法读取这些介质上写的内容,那么这种不降解的持续介质就没什么用。所以Group 47也致力于研究将数据存储成一种永远不会被淘汰的格式。

Hummel说:「假设我们解决了媒介问题,你能够将这种媒介放在架子上,而它就安静地在那里待上几十年,等着你再次打开。但这种文件格式怎么办?如果我给你一份来自于1985年的保存完好的办公文档,你也没办法打开它,因为能够处理它的软件早已不存在了。」

所以,Group 47的Dan Rosen发明了一种叫做bitplain的系统,这种系统不将数据存储成特定格式。比如,一张图片并不存储为JPEG格式,而是被分解成它的最小组成部分——组成该图片每个像素的16位或24位比特数据。之后每一位比特的值(1或0)以及它们的排列组合被烧录到金属上。

但是,将文件写入bitplain 有一个缺点——它比其他形式的存储要求更多空间。一部4K的电影大约为8T,而每个DOTS卷带只能刻入1.2T数据,所以7个卷带才能储存得下。而用bitplain 则需要10个卷带。Hummel解释说:「虽然多了两盒,但这种方式既能长久保存又不用担心提取问题。」

加州斯坦福大学David Rosenthal专攻数据储存,在他看来这种意在延长储存时间的媒介忽略了重要的一点。他认为我们所生存的时代,不在线上的资料就不存在。DOTS的系统没有设计出搜索功能,很难查找,这将是个大问题。

Rosenthal正在研究一种方法,将社会上的信息和资料进行多次复制,并且联网。如果其中一个备份盘故障或因人为原因被损毁,网络会调取其他位置的备份盘对其进行补充。该方法和谷歌公司的数据存储策略非常相似,但这里我们讨论的可是国家层面的资料。英国是第一个尝试进行联网备份的国家,其数据库名为SafeNet。它可以保证英国各个大学上传的数字资料都能妥善保管。「如果有备份资料发生损坏或丢失,其他备份会取而代之。」Rosenthal如是说。SafeNet将在明年正式启动。

想象一下末日后,或考古的情景,用电子介质储存的资料可能没那么幸运了。如何恢复是个问题。与书籍和DOTS不同,电子设备一旦损坏就意味着资料全部丢失,碎片是无法读取的。

即便有了Scott、Hummel和Rosenthal等研究人员不懈的努力,如何去存储每一条推特、博客和Instagram依旧是无解之题。支撑我们数字生活的数据遵循着与破碎玻璃杯无法复原相同的热力学定理。「很早以前,我就已经不再对抗熵增的事实了,」Scott说。「生活将一切打碎和卷走。这种事情无处不在。这就是生活的一部分。」

猎牛网
猎牛网 编辑
双引号 猎牛网是一个专注科技观点和智能硬件评测的科技媒体,这里有各领域资深人士针对产品给出的专属测评报告和最新的科技资讯,全方位解读移动互联网。 双引号
切换注册

登录

忘记密码 ?

切换登录

注册