专栏名称: 生信技能树
生物信息学学习资料分析,常见数据格式及公共数据库资料分享。常见分析软件及流程,基因检测及癌症相关动态。
目录
相关文章推荐
杭州本地宝  ·  杭州市区将新增一家三甲医院! ·  昨天  
余杭发布  ·  春节刚过,这些地方热火朝天…… ·  3 天前  
51好读  ›  专栏  ›  生信技能树

单细胞亚群的命名的细致程度需要有一个度

生信技能树  · 公众号  ·  · 2024-06-18 23:27

正文

看到了首都医科大学的北京积水潭医院的一个2024的单细胞数据挖掘文章,标题是:《Single-cell RNA sequencing and transcriptomic analysis reveal the critical signatures involved in nonhealing diabetic foot ulcers》:

  • The single-cell data file GSE165816, which includes a sample dataset of 22 DFU cases
  • bulk表达量队列用来构建诊断模型:The training set consisted of the GSE134431 dataset, and the GSE143735 dataset was utilised as the testing set.
  • Five key genes were identified: TXN , PHLD A2 , RPLP1 , M T1G , and SDC4 .

可以看到,这个时候已经是有了  M1 macrophages, natural killer T (NKT) cells, plasma cells 这样的单细胞亚群:

作者的第一层次降维聚类分群后的12个亚群被命名为10个生物学功能群: smooth muscle cells (SMCs), fibroblasts, endothelial cells, basalKera cells, M1 macrophages, natural killer T (NKT) cells, plasma cells, cycling cells, lymphatic endothelial cells, and mast cells

如果我们下载GSE165816这个单细胞转录组数据集自己做一次降维聚类分群,很容易看到 上面的数据挖掘文章认为的M1 macrophages, natural killer T (NKT) cells, plasma cells 这样的单细胞亚群,应该是重命名为 髓系免疫细胞亚群,t和b主要的淋巴系免疫细胞亚群。 如下所示:

而且也可以看这个GSE165816 单细胞转录组数据集的原文,是2021的NC杂志的文章:《Single cell transcriptomic landscape of diabetic foot ulcers》,确实是很细致了,把 髓系免疫细胞亚群,t和b主要的淋巴系免疫细胞亚群都细分出来了,比如髓系免疫细胞亚群 就有巨噬细胞和单核单细胞,其中单核细胞还有cd14和cd16的细分。然后t淋巴细胞里面有nk和nkt,b淋巴细胞里面有plasma,如下所示:

休假三个月

所以没办法创作生物信息学数据分析教程,只能说是勉强打开电脑看看文献,找一下简单的bug哈,如果大家看到了类似的可能会有bug的文献,欢迎添加我微信发给我文献pdf咱们一起复现看看哦!前面我已经是diss了4个文献, 让我们再回顾一下这4个diss文献吧:

2024的3月份在Nature Medicine 杂志的文章

标题是:《Single-cell transcriptomic analyses reveal distinct immune cell contributions to epithelial barrier dysfunction in checkpoint inhibitor colitis》,这个文章是发表在2021的预印本的研究,也就是说早在2020左右就已经完成了152个样品的单细胞转录组,那个时候起码还得三四万一个样品,这就是500万人民币的经费在燃烧了。

对应的数据集是:GSE206301,下载它提供的每个样品的表达量矩阵文件和cellranger报表,就会发现每个样品质量都惨不忍睹!

详见: 质量不够就靠数量来凑的顶刊单细胞文章

2024的  sorted CD45+CD19+ B cells  细分亚群

标题是:《Intratumoral CD38+CD19+B cells associate with poor clinical outcomes and immunosuppression in patients with pancreatic ductal adenocarcinoma》,如果是复现作者的数据分析,可以看到作者定义的 SSR4+ cluster  就很尴尬了其实是流式细胞技术的缺陷让b细胞里面混入了 pDC 这个单细胞亚群而已。详见: 流式细胞筛选能保证多大程度的细胞亚群纯度呢

详见: 公共数据库验证出来了就是对的吗

2024的 淋巴管血管侵犯相关肿瘤成纤维细胞

中山大学孙逸仙纪念医院的新鲜出炉的单细胞文章: PDGFRα+ITGA11+成纤维细胞通过 ITGA11-SELE 相互作用促进早期癌症的淋巴血管侵袭和淋巴转移 ,是13个scRNA样本,包括4个癌旁,6个淋巴血管侵犯(LVI)positive,3个LVI negative。对应的数据集是:GSE222315。关注点就是 PDGFRα+ITGA11+成纤维细胞就是作者的 编号1的成纤维亚群 ,它确实是可以非常好的区分成为两个单细胞亚群,作者的编号2和3亚群其实就是免疫细胞和上皮细胞,但是因为并不是文章的重点所以这个小瑕疵就无伤大雅了。

详见: 如果你定位到了个不纯粹的单细胞亚群







请到「今天看啥」查看全文