据科技网站Computerworld报导,微软和华盛顿大学探索人员曾经展现了欺诈人为合成DNA做为数据储备介质的技艺。探索人员示意,假若这一技艺老练到恰当干流运用,配备现在储备密度最高的储备配置、沃尔玛超市般巨细的数据核心,就大概“瘦身”到一伙方糖巨细,“咱们觉得,思量把DNA做为储备介质,寻求相干系统策画题目的机遇曾经老练”。
DNA储备密度惊人
探索团队胜利地将4个图片文献的数据编码为人为合成DNA片断的核苷酸序列。更急迫的是,他们能完成逆流程——从更大的DNA池中取回切确的核苷酸序列,再建图象,况且没有遗失1个字节的音信。另一项实验波及对视频文献的编码和读取。
DNA储备技艺
华盛顿大学盘算机科学和技艺副教学、论文共通做家路易斯·塞兹(LuisCeze)在一份申明中说,“性命形成了奇异的DNA,它能高效地储备与基因和性命行动干系的总共音信,况且特别紧凑,特别‘耐用’。咱们将把DNA用于数据储备——图象、视频、文档,保管光阴能够长达数百或数千年。”
DNA储备技艺探索希望疾速
对DNA数据储备技艺的探索希望疾速。年,探索人员欺诈DNA储备技艺编码和复原了一条长23个字母的音信。到年,欧洲分子生物学实践室-欧洲生物音信学探索所的科学家,把美国黑人行动首脑马丁·路德·金(MartinLutherKing)《我有一个理想》演讲的mp3文献编码在DNA中。
探索人员在发布在《天然》上的论文中称,这类编码法子使得约一杯DNA能储备起码1亿小时的高清视频。
据英国探索人员称,储备在DNA链中的数据能保管数万年。
在DNA储备技艺中,读取DNA相对浅显,紧要妨碍在于写DNA。DNA储备技艺存在两个难点:其一,方今的法子只可合成短链DNA;其二,写和读DNA都浅显犯错。
微软和华盛顿大学探索人员称,他们曾经开采了“一种新奇的法子”,把数据中的“1”和“0”字符串调动成DNA序列中的4种碱基——腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。
为了造访储备的数据,探索人员在DNA序列中编码了相当于邮政编码和街道住址的寻址音信。会合酶链反映(如下简称“PCR”)技艺协助探索人员更轻便地鉴别他们须要搜索的“邮政编码”。
探索人员而后欺诈DNA测序技艺,“读取”数据,并经过欺诈“街道住址”对数据实行整顿,将数据复原成本来的视频、图象或文档。
探索人员示意,“DNA是一种有吸引力的潜在数据储备介质”,理论上其储备密度比磁带超出8个量级,一个能够拿在手里的磁带盒储备容量高达TB。
微软和华盛顿大学探索人员也阐明了人为合成DNA的“龟龄”,称纵然在顽劣处境中其半衰期也超出年,磁带保管光阴为10-30年,硬盘为3-5年。
还不敷完好
美国探索人员强调了提升储备密度的紧急性。商场探索公司IDC和储备配置厂商EMC在《TheDigitalUniverse》探索论文中称,到年,包罗在寰球盘算机、史乘档案、片子、相片、企业系统和挪动配置中的数据量将抵达44万亿GB,“是年的10倍。只管并非总共音信都须要保管,但全国生成数据的速率快于储备容量的延长”。
要投入商用阶段,DNA储备系统再有一些题目须要收拾。首先是DNA合成和测序还远不敷完好,DNA储备系统的一个关键部份是开采一种合适的编码技艺,经过补充冗余度提升容错能耐。
其次,DNA储备系统中随机存取数据照样个题目,读取推迟远善于写入推迟。方今的技艺只可批量读取数据,纵然只从储备系统中造访一个字节的音信,系统也必需对全部DNA池实行测序妥协码。
把数据编码为DNA序列
探索人员曾经提议了鼎新随机数据存取的法子,即欺诈PCR只扩增盼望读取的数据,并对响应的DNA序列测序。这类法子既能提升数据读取速率,也无需对全部DNA池实行测序。
塞兹称,“这是咱们在数据储备方面向大天然进修的一个规范。”
本