作者:倪伟波/整理 来源: 发布时间:2018-2-1 15:54:30
2017 世界十大科技进展新闻
DNA存储:开启数据新时代

 
人类正面临着一个数据存储问题——全世界在过去两年中产生的数据比之前数据的总和还要多,并且这种信息迸发的趋势很快就将超过硬盘能够承载的能力。
 
不过不用担心,研究人员称他们已经找到了一种新的方法来编码DNA中的数字数据,以创建前所未有的最高密度大规模数据存储方案。
 
在2017年3月2日发表于《科学》杂志的一项研究中,哥伦比亚大学和纽约基因组中心的研究人员,描述了一种可以最大化DNA分子数据存储能力的新编码技术。
 
在这套系统中,1克DNA具有存储215拍字节(2.15亿千兆字节)的能力。原则上,它可以将人类有史以来的所有数据存储在一个大小和重量相当于两辆小货车的容器中。
 
实际上,用DNA存储数字数据有许多优势。它是超小型的,如果保存在阴凉、干燥的地方,可以几十万年不损坏。只要人类社会能阅读和编写DNA,就能够对其进行解码。
 
“DNA不会像盒式磁带和CD那样随着时间的推移而衰减,它不会过期。”哥伦比亚大学计算机科学家Yaniv Erlich说。也不像其他高密度的存储方式,比如操纵表面上的个别原子,这项新技术可以一次写入和读取大量的DNA,且可以放大。
 
其实,早在2012年,科学家们便开始使用DNA存储数字数据。不过,当时科研人员的编码方案相对低效,每克DNA仅能存储1.28PB。后来也有一些方法做得更好,但没有一个能够存储超过研究人员认为DNA实际可以处理的一半的存储量(研究人员认为每个DNA核苷酸可以存储约1.8比特,而不是2比特,是考虑到DNA写入和读取中罕见但不可避免的错误)。
 
Erlich认为他可以接近这一极限。因此,他和纽约基因组中心的助理研究员Dina Zielinski研究了用于编码和解码数据的算法。如今,他们刊登在《科学》上的新成果也证实了这一点。
 
科研人员还指出,这种方法工作得很好,新文件不包含任何错误。他们还可以通过聚合酶链反应(一种标准DNA复制技术)为这些文件制作几乎不受数量限制的无差错文件副本。Erlich说,他们能够在每个核苷酸编码1.6比特的数据,这比之前其他的任何方法都多了60%,并且是理论极限值的85%。
 
不过,这项技术能否推进还取决于它的成本。因为每次读取数据需要花费漫长的时间和高额的成本,这一成本甚至高于将数据植入DNA的成本。但是,Erlich和Zielinski指出,成本高昂是由于对于DNA品质的苛求,直接跳过DNA质检的步骤会直接减低成本,而他们相信随之而来的错误率会被系统本身很好地修正。■
 
《科学新闻》 (科学新闻2018年1月刊 封面)
发E-mail给:      
| 打印 | 评论 |