如果大家选择了策略一,就需要在自己的生物学背景下挑选一个合适的数据集,然后对这个单细胞转录组进行降维聚类分群后挑选任意一个亚群的特异性高表达量基因作为课题开始。比如2024的这个文章:《A Novel Tumor-Associated Neutrophil-Related Risk Signature Based on Single-Cell and Bulk RNA-Sequencing Analyses Predicts the Prognosis and Immune Landscape of Breast Cancer》,就是挑选了GSE114725这个乳腺癌的单细胞转录组数据集 ,
做了降维聚类分群,然后定位到了Tumor-associated neutrophils (TANs) ,然后选择了它的 482 differentially expressed genes as marker genes of TANs.
p ggsave(plot=p, filename="check_myeloids_marker_by_celltype.pdf")
蛮方便的,大家可以复制粘贴我的代码去自己的单细胞项目里面的髓系免疫细胞里面赶快看看哦。
网页工具并不是万能的
首先,这个网页工具是对所有人公开访问,所以理论上你能拿到的图表和基因别人就能拿到一模一样的,这样的话一模一样的图表出现在两个不同的文章里面就很难说算不算学术不端了。
而且,网页工具肯定是不支持大家自定义组合多个数据集,比如新鲜出炉的《Integrated analysis of single- cell RNA sequencing and bulk transcriptome data identifies a pyroptosis-associated diagnostic model for Parkinson’s disease》,就是3个帕金森综合征的单细胞数据集的整合,如下所示 :