看到了首都医科大学的北京积水潭医院的一个2024的单细胞数据挖掘文章,标题是:《Single-cell RNA sequencing and transcriptomic analysis reveal the critical signatures involved in nonhealing diabetic foot ulcers》:
-
The single-cell data file GSE165816, which includes a sample dataset of 22 DFU cases
-
bulk表达量队列用来构建诊断模型:The training set consisted of the GSE134431 dataset, and the GSE143735 dataset was utilised as the testing set.
-
Five key genes were identified: TXN , PHLD A2 , RPLP1 , M T1G , and SDC4 .
可以看到,这个时候已经是有了 M1 macrophages, natural killer T (NKT) cells, plasma cells 这样的单细胞亚群:
作者的第一层次降维聚类分群后的12个亚群被命名为10个生物学功能群:
smooth muscle cells (SMCs), fibroblasts, endothelial cells, basalKera cells, M1 macrophages, natural killer T (NKT) cells, plasma cells, cycling cells, lymphatic endothelial cells, and mast cells
如果我们下载GSE165816这个单细胞转录组数据集自己做一次降维聚类分群,很容易看到
上面的数据挖掘文章认为的M1 macrophages, natural killer T (NKT) cells, plasma cells 这样的单细胞亚群,应该是重命名为 髓系免疫细胞亚群,t和b主要的淋巴系免疫细胞亚群。
如下所示:
而且也可以看这个GSE165816 单细胞转录组数据集的原文,是2021的NC杂志的文章:《Single cell transcriptomic landscape of diabetic foot ulcers》,确实是很细致了,把 髓系免疫细胞亚群,t和b主要的淋巴系免疫细胞亚群都细分出来了,比如髓系免疫细胞亚群 就有巨噬细胞和单核单细胞,其中单核细胞还有cd14和cd16的细分。然后t淋巴细胞里面有nk和nkt,b淋巴细胞里面有plasma,如下所示:
休假三个月
所以没办法创作生物信息学数据分析教程,只能说是勉强打开电脑看看文献,找一下简单的bug哈,如果大家看到了类似的可能会有bug的文献,欢迎添加我微信发给我文献pdf咱们一起复现看看哦!前面我已经是diss了4个文献,
让我们再回顾一下这4个diss文献吧:
2024的3月份在Nature Medicine 杂志的文章
标题是:《Single-cell transcriptomic analyses reveal distinct immune cell contributions to epithelial barrier dysfunction in checkpoint inhibitor colitis》,这个文章是发表在2021的预印本的研究,也就是说早在2020左右就已经完成了152个样品的单细胞转录组,那个时候起码还得三四万一个样品,这就是500万人民币的经费在燃烧了。
对应的数据集是:GSE206301,下载它提供的每个样品的表达量矩阵文件和cellranger报表,就会发现每个样品质量都惨不忍睹!
详见:
质量不够就靠数量来凑的顶刊单细胞文章
2024的 sorted CD45+CD19+ B cells 细分亚群
标题是:《Intratumoral CD38+CD19+B cells associate with poor clinical outcomes and immunosuppression in patients with pancreatic ductal adenocarcinoma》,如果是复现作者的数据分析,可以看到作者定义的 SSR4+ cluster 就很尴尬了其实是流式细胞技术的缺陷让b细胞里面混入了
pDC
这个单细胞亚群而已。详见:
流式细胞筛选能保证多大程度的细胞亚群纯度呢
。
详见:
公共数据库验证出来了就是对的吗
2024的 淋巴管血管侵犯相关肿瘤成纤维细胞
中山大学孙逸仙纪念医院的新鲜出炉的单细胞文章:
PDGFRα+ITGA11+成纤维细胞通过 ITGA11-SELE 相互作用促进早期癌症的淋巴血管侵袭和淋巴转移
,是13个scRNA样本,包括4个癌旁,6个淋巴血管侵犯(LVI)positive,3个LVI negative。对应的数据集是:GSE222315。关注点就是 PDGFRα+ITGA11+成纤维细胞就是作者的
编号1的成纤维亚群
,它确实是可以非常好的区分成为两个单细胞亚群,作者的编号2和3亚群其实就是免疫细胞和上皮细胞,但是因为并不是文章的重点所以这个小瑕疵就无伤大雅了。
详见:
如果你定位到了个不纯粹的单细胞亚群