新功能、新界面、新体验,扫描即可下载生物谷APP!
首页 » 会议 » ASPLOS:利用DNA分子存储和检索数字图片和视频

ASPLOS:利用DNA分子存储和检索数字图片和视频

来源:生物谷 2016-04-11 11:52


 

2016年4月11日/生物谷BIOON/--技术公司经常构建不断扩大的数据中心来储存所有的婴儿图片、财务交易数据、搞笑的猫视频和用户储藏的电子邮件消息。
 
但是由美国华盛顿大学和微软公司研究人员开发出的一种新技术可能能够降低储存数字数据所需的空间。
 
一个由计算机科学家和电子工程师组成的团队利用这种新技术详细地描述了首个完整系统。这个系统利用DNA分子编码、存储和检索数字数据,能够比当前的文档技术上百万倍紧凑地储存信息。
 
在2016年4月举行的ACM编程语言与操作系统体系结构支持国际会议(ACM International Conference on Architectural Support for Programming Languages and Operating Systems)上,这个团队提交一篇论文,论文标题为“A DNA-Based Archival Storage System”。根据论文中描述的一项实验,他们成功地将来自4个图像文件的数字数据编码为人工合成DNA片段的核苷酸序列。
 
更为显著的是,他们也能够反着使用这一过程---从更为大型的DNA库中检索到正确的序列,并利用这些序列重建图像,而且不丢失一个字节的信息。
 
这个研究团队也能够利用DNA分子对视频文件进行编码、存储和检索。
 
论文共同作者、华盛顿大学计算机科学与工程副教授Luis Ceze说,“生命产生这种神奇的DNA分子,它能够有效地储存关于你的基因和一种生命系统如何工作的所有信息---它是非常非常紧凑的,而且是非常持久的。我们实际上正改变它的用途,以一种可管理的方式上百年或上千年地存储数字数据---图片、视频和文档。” 
 
数字世界---所有包含在我们的计算机文件、历史文档、影片和图片集中的数据和全世界企业和设备收集的不断增加的数字信息容量---到2020年有望达到44万亿GB(gigabyte, 十亿字节)。
 
相比于2013年,它将增加10倍。尽管并不是所有这样的信息都需要储存,但是世界产生数据的速度快于能够储存数据的速度。
 
DNA分子储存信息的密度能够比现存的数字存储技术---闪存盘、硬盘驱动器和电磁与光学媒介---高数百万倍。这些存储系统在几年或几十年后容易发生质量退化,然而DNA能够可靠地几个世纪地存储信息。DNA最适合用于文档储存应用,而不是文件需要马上存取的情形。
 
通过与微软研究院紧密合作,这个研究团队正在开发基于DNA的储存系统,该系统有望能够解决世界对文档储存的需求。
 
首先,研究人员开发出一种新的方法将数字数据中的一长串1和0转换为DNA中的4个碱基:腺嘌呤(adenine, A)、鸟嘌呤(guanine, G)、胞嘧啶(cytosine, C)和胸腺嘧啶(thymine, T)。
 
论文共同作者、华盛顿大学电气工程副教授、计算机科学与工程副教授Georg Seelig说,“如何把0和1转换为A、G、C和T非常重要,这是因为如果使用一种灵巧方法,就能够让它非常密集,而且也不会产生很多错误。如果做错了,就会产生大量错误。”
 
数字数据能够被分成几块,并通过合成大量的小片段DNA分子进行储存,不过,DNA分子能够脱水,不能够进行长期保存。
 
研究人员也证实利用这种方法能够进行“随机存取”---从大型随机合成DNA分子库中鉴定和检索出正确的序列。
 
为了随后访问储存的数据,研究人员也将类似于邮政编码和街道地址的识别信息编码到这些DNA序列中。使用聚合酶链式反应(PCR)---分子生物学中经常使用的一种技术---有助他们更容易地鉴定出他们寻找的这些识别信息。利用DNA测序技术,他们随后能够“读取”这些数据,利用这些识别信息对它们进行重新排序,将它们转换回视频、图片或文档文件。
 
当前,DNA存储可行性的最大障碍在于大规模地合成(或者说制造)和测序(或者说读取)DNA的成本和效率。但是,研究人员说,如果有正确的激励到位的话,那么实现这些目标并不存在技术上的障碍。
 
DNA储存上的进步依赖于生物技术行业开创的技术,也需要整合新的专业知识。比如,这个研究团队的编码方法借用于计算机内存中经常使用的纠错方案,而这种方案之前并未用于DNA上。
 
Ceze说,“这个例子说明我们可以借助大自然中的DNA来储存信息。但是我们正在借用来自计算机领域的技术---如何纠正内存错误---,并将这种技术用于DNA中。”
 
微软研究院研究员Karin Strauss说,“这种多学科交叉方法让这个项目令人兴奋。我们正借鉴多种学科的知识扩大DNA的应用范围,也因此构建一种密度和耐久性前所未有的储存系统。”(生物谷 Bioon.com) 

本文系生物谷原创编译整理,欢迎转载!点击 获取授权 。更多资讯请下载生物谷APP

A DNA-Based Archival Storage System

doi:10.1145/2872362.2872397

James Bornholt, Randolph Lopez, Douglas M. Carmean, Luis Ceze, Georg Seelig, Karin Strauss

Demand for data storage is growing exponentially, but the capacity of existing storage media is not keeping up. Using DNA to archive data is an attractive possibility because it is extremely dense, with a raw limit of 1 exabyte/mm3 (109 GB/mm3), and long-lasting, with observed half-life ofover 500 years. This paper presents an architecture for a DNA-based archival storage system. It is structured as a key-value store, and leverages common biochemical techniques to provide random access. We also propose a new encoding scheme that offers controllable redundancy, trading off reliability for density. We demonstrate feasibility, random access, and robustness of the proposed encoding with wet lab experiments involving 151 kB of synthesized DNA and a 42 kB randomaccess subset, and simulation experiments of larger sets calibrated to the wet lab experiments. Finally, we highlight trends in biotechnology that indicate the impending practicality of DNA storage for much larger datasets.

温馨提示:87%用户都在生物谷APP上阅读,扫描立刻下载! 天天精彩!


相关标签

最新会议 培训班 期刊库