专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
目录
相关文章推荐
生物学霸  ·  拒绝无效投稿!25 ... ·  15 小时前  
生物学霸  ·  AI 助攻,西湖大学破解多肽分子设计密码 ·  昨天  
BioArt  ·  Nat Commun | ... ·  2 天前  
生信宝典  ·  微生物组-宏基因组分析专题研讨会 ... ·  3 天前  
51好读  ›  专栏  ›  生信宝典

国家生物信息中心合作研发DNA数据活字存储打印系统“毕昇一号”

生信宝典  · 公众号  · 生物  · 2025-03-19 21:00

正文

点击上方蓝字,发现更多精彩



ADVS-12(9)_U1.jpg

大数据时代全球数据量呈指数级增长,海量数据是AI解锁大模型的钥匙 。但目前的硬盘、磁带、U盘等硅基存储介质存在寿命短(最长30年)、能耗高、占用空间大等问题,已无法满足日益增长的数据存储需求。预计到2028年,全球年产数据量将达 380 ZB ,其中80%为冷数据,应用目前存储技术只有不到1%的数据可被保存,发展新型数据存储技术势在必行。

DNA作为天然的数据信息编码存储材料(A-T-C-G四进制编码),因其高密度(为现有存储介质的107倍)、长寿命(低温下可稳定保存长达数千万年)、低能耗等优点,成为一种极具潜力的解决大数据存储困境的替代方案。但是,目前绝大多数DNA数据存储技术采用类似“雕版印刷”的设计策略,存储用DNA使用一次,合成一次,合成成本高,耗时长,极大限制了DNA 存储技术的实际应用。

为了突破现有DNA 存储技术的应用瓶颈,国家生物信息中心应用发展部陈非研究团队与中国科学院计算技术研究所处理器全国重点实验室谭光明、卜东波团队、中科计算技术西部研究院段勃团队合作,借鉴我国古代四大发明之“活字印刷术”逻辑,创新提出了一种经济高效的“DNA活字存储”设计思路,其核心是“ DNA活字 ”,它由 预制的20 nt短双链DNA片段构成,可编码1字节的内容、地址或校验数据信息 每个片段两端带有4 nt的粘性末端,通过一步多级酶连技术形成DNA活字块 ,最终,这些 活字块可通过活字块两端的限制性酶切位点克隆到质粒中直接体外保存 ,其亦可通过转化大肠杆菌体内保存。为了实现DNA活字存储流程的自动化,团队研发了一款可实现DNA活字高通量打印写入的设备——DNA活字喷墨打印机“毕昇一号”,成功打印存储并100%精准解码了文本、图片、音频和视频等多种类型的计算机数据存储文件。

类似于活字印刷的复用性和灵活性,目前的 DNA活字存储技术展现出显著的成本和效率优势。经研究团队估算,目前初代系统一个DNA活字可打印10000次,存储成本可降至122美元/MB,低于目前所有报道的DNA数据存储系统;初代系统的打印效率约为4字节/秒,用时远低于目前的从头合成的DNA存储技术;这不仅展现了该技术未来商业化与产业化的巨大潜力,也为DNA数据存储技术的未来发展提供了全新的思考范式。

上述研究成果以标题为“Cost-Effective DNA Storage System with DNA Movable Type”的封面文章形式发表在 Advanced Science。


科研进展.jpg


DNA活字存储流程图


国家生物信息中心陈非研究员、中国科学院计算技术研究所谭光明、卜东波研究员以及西部高等技术研究院段勃研究员为文章的共同通讯作者。该研究得到国家重点研发计划、国家自然科学基金等项目的资助。


点击阅读原文看论文全文


高颜值免费 SCI 在线绘图 ( 点击图片直达 )


最全植物基因组数据库IMP ( 点击图片直达 )

往期精品 ( 点击图片直达文字对应教程 )







请到「今天看啥」查看全文