专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
生物学霸  ·  3 校合并,公办新大学来了 ·  昨天  
生物制品圈  ·  普祺医药宣布完成超3亿元B轮系列融资! ·  4 天前  
生信宝典  ·  2025 年2月 | ... ·  3 天前  
生物探索  ·  Nature | ... ·  3 天前  
生物学霸  ·  基金委:优青、杰青结题延续,需在 ... ·  3 天前  
51好读  ›  专栏  ›  生信菜鸟团

单细胞水平的差异分析是不是就会合理的产出这样的火山图呢

生信菜鸟团  · 公众号  · 生物  · 2024-12-30 16:34

主要观点总结

本文介绍了一篇关于单细胞数据挖掘的文章,文章重新处理了GSE176078数据集,对乳腺癌患者的单细胞表达量矩阵进行了降维聚类分群,并深入研究了恶性上皮细胞。文章还提到了差异分析的结果展示方式及需要注意的问题,并介绍了学徒作业的相关内容和要求。

关键观点总结

关键观点1: 文章背景和目的

文章重新处理了GSE176078数据集,包含26个乳腺癌患者的单细胞表达量矩阵,目的是通过单细胞分析探索肿瘤微环境和细胞粘附,揭示白细胞介素-1β在乳腺癌中的促增殖作用。

关键观点2: 单细胞亚群的识别

通过简单的降维聚类分群,文章识别了多种单细胞亚群,如CAF细胞、内皮细胞、上皮细胞、髓样细胞、B细胞和plasmablast细胞等。但第一层次降维聚类无法区分恶性与否的上皮细胞,需要进一步进行inferCNV等流程来判断。

关键观点3: 恶性上皮细胞的差异分析

文章提取恶性上皮细胞后,根据患者的临床分组(five HER2+、12 ER+/PR+、and nine TNBC samples)进行差异分析,得到了火山图。虽然火山图展示方式可能不太理想,但如果这是基于恶性上皮细胞的单细胞表达量矩阵分组,那么结果可能是合理的。

关键观点4: 学徒作业介绍及要求

学徒作业需要重新处理GSE176078数据集,对单细胞表达量矩阵进行严格的质量控制,提取上皮细胞进行细分亚群并鉴定恶性情况,然后根据tnbc与否进行二分组进行差异分析。完成此作业需要有自己的计算机资源,并具备基本的生物信息学基础。

关键观点5: 相关服务和课程推荐

提到了相关的服务和课程推荐,如共享服务器、生物信息学马拉松授课和单细胞及空间多组学实验技术与生信分析培训,以帮助感兴趣的人入门或进一步提高相关知识。


正文

看到了一个新鲜出炉的单细胞数据挖掘文章,标题是:《Single-cell analysis of tumor microenvironment and cell adhesion reveals that interleukin-1 beta promotes cancer cell proliferation in breast cancer》,研究者重新处理了GSE176078这个数据集,里面是26个乳腺癌患者的单细胞表达量矩阵 (five HER2+, 12 ER+/PR+, and nine TNBC samples) 。

很简单的降维聚类分群后,可以看到是如下所示是的主要单细胞亚群 :

  • 6500 CAF cells (markers: COL1A1, COL3A1, and DCN),
  • 7600 endothelial cells (markers: CLDN5 and CDH5),
  • 28200 epithelial cells (markers: EPCAM, KRT8, and KRT18),
  • 9500 myeloid cells (markers: CD68, CD163, CD14, and LYZ),
  • 3200 B cells (markers: CD79A, CD19, and MS4A1),
  • 3500 plasmablast cells (markers: CD79A, MZB1, CD38, and IGHG1),
  • 35200 T cells (markers: CD3D, CD3E, and CD8A)

这个是比较容易的:

第一层次降维聚类分群

而且很明显,第一层次降维聚类分群其实是没办法区分 28200 epithelial cells (markers: EPCAM, KRT8, and KRT18),  里面的 恶性与否的上皮细胞,这个时候需要走inferCNV等流程对上皮细胞进行恶性程度的判断。

然后,作者找出来了这26个乳腺癌患者的单细胞表达量矩阵里面的恶性的上皮细胞后,根据病人的临床分组  (five HER2+, 12 ER+/PR+, and nine TNBC samples)  做差异分析,居然得到了如下所示的一个看起来有点奇怪的火山图:

看起来有点奇怪的火山图

如果是这个火山图是基于bulk表达量矩阵,无论是表达量芯片还是转录组测序,的差异分析后的可视化,很明显就有问题的。一般来说log2FC绝大部分都是5以内,大于10的都很少很少了。但是上面的差异分析结果来源于恶性上皮细胞的单细胞表达量矩阵分组,所以有可能是合理的,仅仅是火山图的展示方式不太好了。

学徒作业

重新重新处理了GSE176078这个数据集,里面是26个乳腺癌患者的单细胞表达量矩阵,然后对它进行严格的质量控制后,做出来第一层次降维聚类分群后,提取里面的上皮细胞进行细分亚群后,鉴定里面的恶性情况,然后取里面的恶性上皮细胞根据tnbc与否进行二分组然后进行差异分析哈!

如果你想完成上面的学徒作业,最好是有自己的计算机资源哦,比如我们的2024的共享服务器交个朋友福利价仍然是800,而且还需要有基本的生物信息学基础,也可以看看我们的生物信息学马拉松授课(买一得五) ,你的生物信息学入门课。

如果你有了生物信息学基础,仅仅是感兴趣单细胞的细致分析,就看看SBC的 Nature年度技术 | 单细胞及空间多组学实验技术与生信分析培训(暑期班)招生火热进行中