近日,上海交通大学樊春海、宋萍、左小磊团队在Nature Communications期刊上发表题为“Massively parallel homogeneous amplification of chip-scale DNA for DNA information storage (MPHAC-DIS)”的最新研究。该研究开发了基于热力学自由能驱动的高通量引物设计方法(MPHAC),实现了低浓度核酸序列的平行、均匀扩增。基于该方法构建的DNA存储系统与文本、图片、视频等多模态文件类型兼容,并以99%上解码正确率对任意文件子集进行随机访问。
随着全球数据量的指数级增长,DNA以其超高存储密度、长半衰期以及低能耗优势,成为解决大规模数据存储需求的重要突破口。然而,当前DNA信息存储仍面临显著挑战,包括高昂的DNA合成与测序成本等问题。基于芯片的大规模DNA合成技术可同时合成数百万条DNA分子,极大降低了合成成本,但其产物浓度通常仅为飞摩尔级,远低于二代测序所需的纳摩尔级浓度。传统扩增方法因效率差异,容易产生扩增偏倚,影响数据均一性和测序深度,导致数据读出的准确性下降及测序成本升高。
针对上述问题,团队开发了一种基于热力学控制的均一扩增方法(MPHAC)。该方法通过严格的热力学能控制,辅以GC含量筛选、二级结构检查、引物二聚体过滤、BLAST等手段,实现了对目标序列的高灵敏、高均一性扩增(图1)。相比传统定长引物设计,根据模拟结果,该方法拥有更均匀的扩增效率(Fold-80由3.2降至1.0),在大规模随机访问时最高可使成本下降4个数量级。基于该方法构建的DNA存储系统与多种文件类型兼容,并实现99%以上解码正确率。在此基础上,进一步结合对抗神经网络用于数据修复,最低可在1×测序深度下实现80%正确率。
图1 MPHAC与MPHAC-DIS总览图
团队使用编码自校正查找表的方式,将ASCII文件中每一个字节编码成5个碱基的核酸。通过合成35,406条DNA序列,编码了包含三字经、交大庙门、蒙娜丽莎、登月在内的文本、图片、视频文件,并实现了高效访问与解码(图2)。基于MPHAC优秀的扩增均一性与并行性,其有望推动DNA数据存储的文件存储数目与访问通量迈向新阶段。
图2 MPHAC-DIS 的均一扩增与无损索引
本工作得到了国家重点研发计划、国家自然科学基金、上海市教育委员会“青年领军人才培养计划”项目、上海市科技创新行动计划等的资助。
业务介绍
研理云,研之成理旗下专门针对科学计算领域的高性能计算解决方案提供者。我们提供服务器硬件销售与集群系统搭建与维护服务。 ● 配置多样(单台塔式、两台塔式、多台机架式),按需定制,质量可靠,性价比高。
● 目前已经为全国 100 多个课题组提供过服务器软硬件服务(可提供相同高校或临近高校往期案例咨询)。 ● 公司服务器应用工程师具有量子化学、第一性原理、分子动力学等相关学科研究背景。 ● 公司与多位化学、材料领域理论计算方向专家长期合作,一起探索最优服务器软硬件配置和部署。
● 定制化硬件配置:提供售前实例测试,为您提供最合适的硬件配置方案。 ● 一体化软件服务:根据需求,发货前,完成系统、环境、队列、计算软件等所有内容的安装与配置,让您实现开机即用。 ● 完善的售后服务:为每位客户建立专属服务群,遇到问题及时解决。大大降低使用学生使用门槛和缓解老师压力。三年硬件质保 + 三年免费软件技术支持。 ● 已购买客户咨询:我们已有超过100位已购买客户,可以给您提供相同城市或者临近城市已购买客户的联系方式,以提供真实案例咨询。 ● 赠送课程学习机会:可选课程包括量子化学(Gaussian),第一性原理,(Vasp),分子动力学模拟(Lammps、Grommacs),钙钛矿计算模拟(Vasp)等。具体赠送方案以沟通结果为准。
扫码添加客服微信
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。