主要观点总结
DNA存储技术在存储密度、寿命和能耗方面展现出优势,但当前从头合成大规模数据写入DNA的方法在时间和成本上仍有较高限制。北京大学和其他机构的研究人员在Nature上发表了题为“Parallel molecular data storage by printing epigenetic bits on DNA”的研究论文,提出了一种不依赖于从头合成的并行策略,使用预制核酸在DNA上写入任意数据。该研究通过酶甲基化和自组装引导的方式,实现了分子可移动型印刷,为DNA数据存储提供了新的可能性。
关键观点总结
关键观点1: DNA存储的潜力及当前挑战
DNA存储在存储密度、寿命和能耗方面展现出优势,但数据写入方法和成本仍需改进。
关键观点2: 研究内容概述
研究提出了一种不依赖于从头合成的并行策略,使用预制核酸在DNA上写入任意数据。通过酶甲基化和自组装引导的方式,实现了分子可移动型印刷。
关键观点3: 研究亮点
该研究中的框架是并行的、可编程的、稳定的和可扩展的,为生物分子系统中的实际数据存储和双模式数据功能开辟了道路。
关键观点4: 研究成果意义
该研究为DNA数据存储领域带来了新的突破,有望降低数据储存成本,提高储存密度和寿命,对未来数据领域的发展具有重要影响。
正文
DNA存储已经显示出在存储密度、寿命和能耗方面超越当前基于硅的数据存储技术的潜力。然而,通过从头合成将大规模数据直接写入DNA序列在时间和成本上仍然较高。
2024年10月23日,
北京大学钱珑、欧阳颀、
张成、美国亚利桑那州立大学Hao Yan共同通讯在
Nature
在线发表题为
“
Parallel molecular data storage by printing epigenetic bits on DNA
”
的研究论文,
该研究
出了一种替代的并行策略,可以使用预制核酸在DNA上写入任意数据。通过自组装引导的酶甲基化,表观遗传修饰作为信息位,可以精确地引入到通用DNA模板上,以实现分子可移动型印刷。
全球数据领域的显著扩大对大规模数据存储提出了迫在眉睫的挑战,迫切需要更好的存储材料。受遗传信息在自然界中保存方式的启发,DNA由于其非凡的存储密度和耐久性,最近被认为是一种有前途的数字数据存储生物材料。在目前的DNA存储中,数据通常被转编码成核苷酸碱基序列,而写入依赖于从头合成,其中核苷酸按预定的顺序一个接一个地添加。
尽管从头合成技术在吞吐量和效率上不断进步,但串行合成过程实质上限制了写入速度和合成DNA的长度,并阻碍了数据写入成本的大幅降低。
为了实现高效的DNA存储,不依赖于从头合成的替代数据写入方法应该以并行和可编程的方式工作。事实上,已经提出了一些用于并行书写的优雅设计,例如,通过DNA载体的结构编程,但结构不稳定和信息处理吞吐量有限等问题阻碍了它们的应用。
相反,在人类细胞中,表观基因组在不变基因组序列之上编码稳定的修饰信息。同样,一个对数据进行表观遗传编码的系统可能足以在相同的DNA序列上长期存储信息。然而,目前体外平行书写表观遗传信息在数据选择性方面还不够通用。
因此,为了实现无合成DNA数据存储的目的,一个在通用DNA上编程任意表观遗传信息的框架是可取的。
epi-bits
DNA存储示意图(图源自
Nature
)
受自然表观基因组遗传和合成DNA自组装的启发,研究人员开发了一种非常规的DNA数据写入框架,该框架允许任意表观遗传信息位(epi-bits)以并行方式稳定地写入基于DNA自组装引导的酶甲基化的DNA模板上。
该研究通过对有限的700个DNA可移动类型和5个模板进行编程,在一个自动化平台上实现了大约275,000位的无合成写入,每个反应写入350位。
以复杂表观遗传模式编码的数据通过纳米孔测序高通量检索,并开发了算法,每个测序反应可精细解析240个修饰模式。在表观遗传信息位框架下,60名缺乏专业生物实验室经验的志愿者实现了分布式和定制的DNA存储。
该研究中的框架提出了一种新的DNA数据存储模式,它是并行的、可编程的、稳定的和可扩展的。这种非常规的模式为生物分子系统中的实际数据存储和双模式数据功能开辟了道路。
原文链接:
https://www.nature.com/articles/s41586-024-08040-5