专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
生物制品圈  ·  Moderna寨卡病毒(ZIKV)mRNA疫 ... ·  4 天前  
BioArt  ·  Science | ... ·  5 天前  
BioArt  ·  2024中国空间组学高峰论坛回顾报道 ·  1 周前  
51好读  ›  专栏  ›  生信菜鸟团

【斑马鱼肾脏的单细胞数据集合】:脊椎动物的中性粒与巨噬细胞的分子特征

生信菜鸟团  · 公众号  · 生物  · 2024-10-16 12:30

正文


数据集:

GEO NCBI IDAgeGenotype/StrainNumber of Used SamplesInitial Number of Cells
GSE1009103–9 monthsWT; prkdc611,327
GSE112438not availableAB; CD41:GFP3713,824
GSE1304874–12 monthsWT120,000
GSE1503738 monthsWT; runx1839,424
GSE1512314 monthsWT; gata2b914,463
GSE166646adultWT16422
GSE1760368 monthsrunx1835,178
GSE1794012 monthsWT; rag; rag il2rga947,832
GSE1907944 monthsGESTALT1051,540
GSE191029adultWT; prkcda; cxcl8820,695
GSE2421331-1.5 monthsAB336,600
GSE2460393 monthsWT; cebpb10105,194
GSE2527886 monthscebpb228,534

这篇文章可以很好地作为多数据集整合的学习样板,作者在正文中提供了详细的参数~


当然,遗憾之处在于这篇文章并未提供code。

幸运的是,在邮件request code以后作者非常及时地给了回复【代码长达7677行!而且因为数据集较多,谨慎在本地运行哦】,并建议和讲人类肾脏的【Meta-analysis of single-cell and single-nucleus transcriptomics reveals kidney cell type consensus signatures】互参~


此外,另一篇【斑马鱼心脏的单细胞集合:Transcriptomic data meta‑analysis  reveals common and injury model specific gene expression changes  in the regenerating zebrafish heart】是有代码的,也可以作为参考~


https://github.com/MercaderLabAnatomy/PUB_Botos_et_al_2022


由于这篇文献后续的分析主要是围绕中性粒细胞和巨噬细胞开展的,我们先把他们的marker找出来。

中性粒细胞和巨噬细胞、B细胞还有造血干细胞的marker基于:

Single-cell RNA sequencing unveils the hidden powers of zebrafish kidney for generating both hematopoiesis and adaptive antiviral immunity

CellMarker
neutrophilslyz, mpx, cpa5, cd11b, adgrg3, nccrp1
macrophagesgrna, mpeg1.1, clss2.2, mpeg1.2, grna1
B cellscd37, cd79a, cd79b, ighm
hematopoietic stem cellsdut, npm1a, mki67, snu13b, cnbpa



作者在整合多个数据集以后,针对免疫细胞进行了深入分析——


条件如下:

  1. FindMarkers 函数:only.pos = TRUE(上调),min.pct = 0.02(至少在免疫群体中 2% 的细胞中表达),logfc.threshold = 0.5(在免疫群体中 log2FC ≥ 0.5 时上调)计算免疫相关标记基因

  2. 排除非免疫细胞。

  3. 使用子集功能,筛选出数量较多(每个细胞 3000-30 000 个)、表达 1000-4000 个非零水平基因的免疫细胞,从而去除覆盖率低的免疫细胞

  4. 重复harmony。

  5. PrepSCTFindMarkers 和 FindAllMarkers 计算单个簇的标记基因:only.pos = TRUE(上调),min.pct = 0.25(至少在目标簇 25% 的细胞中表达),logfc.threshold = 0.5(与所有其他簇相比,目标簇中上调 log2FC ≥ 0.5)。


总的来说,这篇文章数据集丰富、配色简洁优雅,思路并不复杂,值得借鉴,不知道是否适用于同一类组织感兴趣细胞的数据挖掘,开开脑洞试试看吧~