主要观点总结
文章介绍了国家生物信息中心蒋岚团队在单细胞测序技术上的新突破,其研发的UDA-seq技术大幅提高了单细胞测序的通量并降低了成本。该技术兼容多模态,支持常见单细胞多组学,如RNA和ATAC、RNA和CRISPR等的共检测。应用于衰老、疾病人群队列研究及高通量CRISPR筛选研究中,展示了其可靠性和高效性。专家点评表明,该技术在人群尺度的单细胞研究中具有重大意义,将促进新的研究范式和重要规律的发现。
关键观点总结
关键观点1: UDA-seq技术突破
国家生物信息中心蒋岚团队研发的新型单细胞多组学测序技术UDA-seq,通过组合标记技术路线优化升级液滴微流控平台,成功实现细胞通量和假单细胞率的“解偶联”,突破通量限制。该技术兼容多模态,同时将单通道细胞通量提高到刷新记录的10万细胞以上。
关键观点2: UDA-seq应用场景及优势
UDA-seq技术应用于衰老、疾病人群队列研究及高通量CRISPR筛选研究。通过对微量冰冻血液样本和微量冰冻活检样本的处理,获取高质量、多模态、单细胞精度数据。建立了从微量样本中获取高质量数据的解决方案,并大幅降低了单例样本的数据成本。
关键观点3: 专家评价与影响
专家对UDA-seq技术评价高,认为其在兼容多模态的同时大幅提高了单细胞测序的通量,为建立可预测可编程的虚拟细胞基础大模型提供了数据支撑。此外,该技术的突破将促进高通量单细胞多组学测序在医学应用中的落地,对疾病研究、新型诊疗开发具有重要意义。
正文
点评 | 汤富酬/谢昊玲(北京大学)、张学工/高浩翔 (清华大学)、乔杰 (北京大学)、金力 (复旦大学)细胞是生命的基本单元。近年来,单细胞组学技术的快速发展前所未有地革新了人类对细胞多样性和异质性的认知,推进了生物医学重大规律的发现,为建立可预测可编程的虚拟细胞基础大模型提供语料。细胞图谱技术被Nature期刊列为2024七大关注技术之一。2024年11月,国际人类细胞图谱计划在Nature期刊及其子刊发表了40余篇论文合集,标志着“细胞身份普查”取得了阶段性成果。下一阶段的重心,则是单细胞多模态和人群尺度的研究,深入解析遗传背景、环境、病理条件与性状和表型之间的复杂互作。然而,当前的单细胞多组学技术的成熟度严重滞后于单细胞转录组技术,在人群队列的大规模研究中面临着通量、普适性等诸多挑战,亟待突破。2025年1月20日,国家生物信息中心计算生物学部蒋岚团队在Nature Methods期刊发表了题为UDA-seq: universal droplet microfluidics-based combinatorial indexing for massive-scale multimodal single-cell sequencing的研究论文。该工作报道了自主研发的新型单细胞多组学测序技术UDA-seq,基于组合标记技术路线优化升级广泛使用的液滴微流控平台,成功实现细胞通量和假单细胞率的“解偶联”,从而突破了通量限制。该技术是广谱型的通量提高策略,支持常见的单细胞多组学,例如同一细胞的RNA和VDJ共检测、RNA和ATAC共检测,以及RNA和CRISPR扰动共检测等。在兼容多模态的同时将单通道细胞通量提高到刷新记录的10万细胞以上,比现有技术提升了10-20倍。同时,利用遗传多样性结合生物信息学拆解,以免标记的方式实现了单通道20-40例人类样本的多路复用,大幅降低单例样本的数据成本。此外,还形成了大规模的从微量冰冻血液样本和微量冰冻活检样本中获取高质量、多模态、单细胞精度数据的完整解决方案。
通用型高通量单细胞多组学技术UDA-seq 流程图及应用场景
研究团队将UDA-seq 应用于三个应用场景中,包括衰老、疾病人群队列研究以及高通量CRISPR筛选研究。首先,对健康人和多种疑难肾病患者的肾脏组织构建了单细胞RNA和ATAC双组学图谱。克服了微量冰冻样品前处理的难点,每例样本仅需五分之一条针穿活检样品,在液滴微流控中利用2个通道的反应收集到来自35例捐献者的一共20万高质量双模态单细胞数据。通过建立新算法,鉴定出与蛋白尿和肾损伤表型相关的罕见细胞类型POD细胞和EC-GC细胞,以及关键细胞亚群的调控网络和关键因子。利用UDA-seq,研究者还构建了自然衰老人群队列的PBMC单细胞转录组和免疫受体序列双组学图谱。利用2个通道的反应,收集到12万高质量单细胞数据,解析了衰老相关的细胞亚型,并报道了衰老相关的新细胞亚型:ITGB1+PREX1+ Naive CD4+ T细胞。最后,UDA-Seq也展示了对高通量CRISPR筛选的兼容,在胃癌细胞系中系统解析了细胞对溴结构域蛋白基因家族扰动的响应。综上,该工作突破现有技术的瓶颈,在兼容多模态的同时大幅提高了单细胞测序的通量,在真实世界样本中证明了可靠性和高质量,实现了低成本的高效数据生产。开发了新算法鉴定临床表型相关的关键细胞亚群、调控网络和关键因子,为人群尺度健康队列和疾病(例如癌症,自身免疫,感染等)队列细胞图谱大规模研究建立了一个新型研究范式。此外,该工作集成常见可及的液滴微流控平台改造提升,有望大规模推广,填补多模态、扰动前后单细胞数据集的匮乏,为下一代的多模态虚拟细胞基础大模型提供数据支撑。上述工作由国家生物信息中心蒋岚团队和多家单位合作完成。蒋岚研究员、北京协和医院陈丽萌教授、中国科学院动物研究所刘光慧研究员、国家生物信息中心张维绮研究员、衢州市人民医院张峰教授、北京大学舒绍坤教授为本文的共同通讯作者。蒋岚团队特别研究助理李芸、博士研究生黄正,北京协和医院徐鲁斌医生,国家生物信息中心助理研究员范艳玲,衢州市人民医院助理研究员平骏为文章的并列第一作者。单细胞组学测序技术给人类生物学研究带来了革命性的改变。据北京大学高歌实验室统计,从2009年到2023年年底,全世界已经发表的、可以下载原始数据的单细胞转录组测序数据大约有2.2亿个细胞,其中人类细胞大约1.2亿个,小鼠细胞大约1亿个。这些数据中大部分来自液滴微流控技术平台。这种单细胞转录组实验的主要花费在液滴微流控操作部分,每次实验(一张芯片上的一个通道)液滴微流控部分的花费是人民币一万元左右,可以测序大约六千个单细胞,高通量测序部分的花费是两千元左右。每个单细胞的全部实验(捕获、扩增和测序)成本大约两元钱。比较理想的单细胞转录组测序的成本应该是每个单细胞一角钱甚至更低。与目前基于液滴微流控技术(如10x Genomics Chromium平台)的单细胞多模态测序方法(比如CITE-seq、Droplet Pair-Tag、sn-m6A-CT)相比,该研究发展的UDA-seq技术,在液滴微流控标准操作(加上第一轮条形码)步骤完成后再增加一轮条形码标记(第二轮条形码,96种或者384种),将单细胞处理通量增加上百倍,极大地减少了细胞间条形码碰撞的概率,从而优化了数据质量,大幅度降低单细胞组学测序的成本。UDA-seq技术巧妙地采用了液滴微流控操作后再添加第二轮条形码的策略,使得实验的前期微流控操作步骤与已有微流控技术完全相同,实验流程更加可控,而且单次微流控实验就能够产生超过10万个单细胞的高质量组学数据。这里的一个关键要点是要在微流控平台处理后单个细胞核仍然是完整的、并且互相不粘连在一起,这样才能保证基于96孔板操作的第二轮条形码标记能够精确实现。同时与现有的标准技术相比,UDA-seq技术大幅降低了实验成本,并在处理冷冻和固定样本时表现出明显优势。特别是在大规模临床队列研究中,UDA-seq技术凭借灵活的设计支持多模态联合分析(比如RNA与ATAC、RNA与VDJ重排、RNA与CRISPR扰动等),为解决复杂的生物学问题提供了更高效的选择。在实际应用中,UDA-seq利用2个通道的反应,成功分析了来自35例冷冻肾脏活检样本中的超过20万个单细胞的转录组,识别出与蛋白尿相关的关键稀有细胞亚群(占比仅0.6%),展现了在临床样本处理和稀有细胞检测中的出色表现。此外,UDA-seq还被用于胃癌细胞系中,采用CROP-seq技术评估溴结构域蛋白基因的功能,进一步证明了其在CRISPR筛选和高通量功能基因组学研究中的潜力。总体来看,UDA-seq技术通过创新的条形码策略和精简的工作流程,克服了现有方法的不足,为基础研究和临床应用提供了一种高效且成本大幅度降低的解决方案。有了UDA-seq技术以后,每次实验(一张芯片上的一个通道)液滴微流控部分的花费仍然是人民币一万元左右,但是可以测序大约10万个单细胞,高通量测序部分的花费是三万元左右(保持每个单细胞的测序量不变)。每个单细胞的全部实验成本大约四角钱,比单纯的液滴微流控技术降低五倍。明年NGS测序技术的成本有望再降低5倍(从每Gb数据20元降低到4元左右),到那时使用UDA-seq技术的单细胞转录组测序,每个单细胞的全部实验(捕获、扩增和测序)成本将降低到一角五分钱左右,这将极大地推动单细胞测序技术在临床上的应用。近年来,人工智能领域不断验证了‘数据规模’与模型能力正相关的规律(Kaplan, Jared, et al.2020)。这一趋势在生命科学中也逐渐显现:Geneformer, scFoundation、scGPT、scMulan等单细胞大模型成果说明,要在单细胞层面构建高准确度、可预测的生命大模型,离不开更大规模、更具多样性的人群数据支撑。然而从单细胞数据库的更新情况(https://cellxgene.cziscience.com/datasets, https://data.humancellatlas.org/ )可以看出,近两年单细胞转录组数据的增速已经放缓。究其原因,一方面是测序成本始终居高难下,另一方面,多组学数据(RNA+ATAC+VDJ 等)在技术和费用上更具挑战性,导致不少团队只能在小规模或单一组学上开展研究。由此形成的‘数据天花板’,难以支持对复杂生命系统的深入解析。中国科学院北京基因组研究所(国家生物信息中心)蒋岚课题组此次在 Nature Methods 发表的 UDA-seq 技术,为打破该瓶颈提供了新的思路。从论文中的实测结果来看,UDA-seq 通过组合索引(Combinatorial Indexing)和对遗传多样性的巧妙利用,一次实验就能捕获 10 万级别的高质量单细胞数据;并且在混合了 20~40 例不同供体的病例样本时,依旧保持较低的交叉污染率和较高的数据准确性。值得强调的是,这种把多样本一次实验处理的方式,不仅提升了细胞通量,也有效降低了单例样本的成本并减少批次效应。UDA-seq 在拓展‘多组学同步测序’方面同样亮点突出。论文中展示了对包括 RNA、ATAC、CRISPR 干扰(CROP-seq)等多种组学信号的同时检测,且在真实病患队列和衰老人群队列中验证了稳定的测序质量和一致性。结合 UDA-seq 对多组学的兼容性,未来我们或许能看到在万人级或更高规模的人群里获取单细胞多组学数据。随着测序成本的进一步下降,加之像 UDA-seq 这样能够显著提高细胞通量、降低建库花费的新技术不断成熟,未来来自不同遗传背景、不同病理状态甚至跨物种的多组学单细胞数据,将能在更高通量、相对低成本的条件下不断累积。通过对这些差异化、规模化的数据进行深度整合,AI 模型将更有望在虚拟细胞、数字孪生、疾病预警和个体化诊疗等方向上取得突破。高通量的单细胞测序技术在研究具有复杂细胞类型的组织特征时具有独特优势,为解析稀有细胞亚群、揭示细胞间相互作用和构建细胞调控网络方面提供了重要的新视角。在疾病研究中,直接利用临床标本进行细胞和分子层面全面分析对揭示病理机制与探索诊疗策略尤为重要。然而,考虑到研究伦理以及常规临床检测对样本的需求,可供科学研究的临床组织通常很少。因此,尽管高通量单细胞测序技术已被广泛应用于器官发育研究和组织细胞图谱的构建,但在以针对活检组织为代表的临床样本中的应用仍然十分有限。尤其在生殖医学领域,如卵巢和睾丸等性腺组织,通常难以获取大量样本。蒋岚团队自主研发的UDA-seq技术是一项具有里程碑意义的新一代高通量单细胞测序方法,创新性地解决了微量临床样本兼容性这一技术瓶颈。UDA-seq通过单次实验从35例肾脏针穿活检组织中成功采集了20万单细胞核的高质量数据,平均每例样本回收细胞数超过5000。每例样本仅需穿刺活检的极少量组织(长度2-3毫米,直径1毫米),利用常规临床检测后的剩余样本即可满足实验需求,无需额外增加患者负担。深度覆盖的数据使得系统性地鉴定与临床表型相关的稀有细胞亚群和关键因子成为可能。该技术大幅降低了样本获取门槛,将高通量单细胞测序技术的临床可及性提升到了一个全新高度。UDA-seq技术的创新性还体现在其多维度数据的解析能力,例如在单个细胞中同时解析转录组和表观遗传染色质状态。通过整合这两种关键信息,揭示了细胞的表型和功能状态,还可深入解析上游调控通路,为疾病发生的分子机制提供多层次的洞察。此外,UDA-seq对冰冻组织的良好兼容性进一步拓宽了应用场景,使得单细胞数据采集模式得以从传统的零散型向中心化和标准化大规模操作转变,为大规模协同研究和数据共享奠定了基础。并且,该技术显著降低了单例样本数据获取的成本,使得微量活检组织的单细胞多组学测序有望成为临床常规操作,是一项国际领先的重要技术突破。UDA-seq技术经济、稳定,具有显著的临床适用性,结合前沿的生物信息学算法和人工智能分析能力,为单细胞多组学测序在基础研究和临床应用领域开辟了全新的路径。随着测序价格的降低,UDA-seq技术将会得到更广泛应用。这些数据的整合和分析将为构建更全面、精确的人体细胞图谱提供基础,也为疾病预防、诊断和治疗提供重要的数据支持。这项成果将促进高通量单细胞多组学测序在医学应用中的落地,对疾病研究、新型诊疗开发具有重要的影响。生物学的核心问题是回答基因型和表型之间的关系。细胞是生命最基本的单元,单细胞分辨率的测序技术是从细胞-器官-个体-人群跨尺度解析上述问题的关键技术。2022年,澳大利亚学者Joseph Powell在Science发文,首次报道了千人队列规模的单细胞图谱,系统鉴定了细胞类型特异的eQTL, 并正在将队列规模进一步拓展到万人规模TenK10K(https://www.garvan.org.au/news-resources/news/international-partnership-to-map-50-million-human-cells-and-uncover-genetic-fingerprints-of-disease)。2024年9月,意大利Human Technopole高级研究员Nicole Soranzo在国际人类细胞图谱年会做了题为Population-scale single cell technologies in cohorts with embedded medical record data的主旨报告,汇报了该团队在人群尺度的单细胞测序方面的最新进展。目前已通过UK BioBank采集了4918人的684万细胞,Genes&Health队列采集了1356人219万细胞的单细胞转录组数据。认为在人群尺度进行单细胞测序意义重大,例如揭示转录和细胞组分的遗传因子,在遗传、表型、环境的丰富采样下对转录调控进行研究,鉴定生理病理的转录标志物,阐明疾病风险位点的分子机制。这些研究表明在人群尺度对表型进行深度剖析是目前领域的前沿。然而,当前单细胞测序技术的成本高昂,对生物样本库的样本兼容度差等瓶颈,限制了此类研究的广泛开展。近日,国家生物信息中心蒋岚团队在Nature Methods报道了一种原创技术UDA-seq,通过将通量大幅提升将单细胞测序的成本降低了一个数量级。UDA-seq支持同一细胞多模态数据的同时采集,代表了单细胞多组学技术在国际范围内的目前最高水平。基于该技术,研究者形成了基于冰冻外周PBMC和冰冻针刺活检样本的完整解决方案,在衰老、肾疾病多种人群队列中高效采集了宏观表型和微观细胞表型一一对应的数据。通过生物信息学分析,成功鉴定到和表型相关的关键细胞亚群。这些结果显示UDA-seq技术是在人群尺度理解人类复杂表型的有力工具,将促进建立新的研究范式和重要规律的发现。原文链接:
https://www.nature.com/articles/s41592-024-02586-y
制版人:十一
BioART战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。