文章:Yuan, M., Wan, H., Wang, Z., Guo, Q., & Deng, M. (2024). SPANN: annotating single-cell resolution spatial transcriptome data with scRNA-seq data. Briefings in Bioinformatics, 25(2), bbad533. https://academic.oup.com/bib/article/25/2/bbad533/7590316
项目地址:https://github.com/ddb-qiwang/SPANN-torch
目前空间转录组技术缺乏量身定制的细胞注释工具,大多都是通过与scRNA-seq数据结合,但这些工具没有考虑到两种数据中的细胞类型映射,另外还缺乏检测新细胞类型的能力。
这里开发的SPANN的主要任务是将细胞类型标记
从注释良好的scRNA-seq数据转移到新生成的单细胞空间转录组数据,并在空间数据中发现新的细胞类型。
SPANN的主要创新来自两个方面:自动检测来自未知细胞类型的新细胞,同时保持对已知细胞类型的高精度注释。
首先看到中间Raw data这里的空间数据和scRNA数据几乎没有重叠,说明了scRNA-seq 和空间转录组数据之间进行映射的必要性。Seurat、Liger、GLUE 和 Uniport使用不同的映射策略,都可以减少两个数据集的差异,但从SeqFISH数据中的潜在信息挖掘不足,以至于很难找到可以拆分的clusters,让下游注释变得困难。只有gimVI可以与SPANN相媲美,SeqFISH对 SeqFISH clusters分离性较好,细胞类型对应关系也比较清晰。但SPANN 的聚类结果更紧凑,而且异常值也较少。
SPANN 在注释已知细胞类型的细胞和检测新细胞之间取得了良好的平衡。比如左侧的桑基图中,左侧是真实的细胞类型,右侧是包含了40%的新型细胞的SeqFISH数据集。SPANN 的预测清楚地捕获了心肌细胞、神经嵴和脊髓的位置。
文末友情宣传
强烈建议你推荐给身边的
博士后以及年轻生物学PI
,多一点数据认知,让他们的科研上一个台阶: