在上一期“
适用于小白的富集分析答疑来了!
”中,小编给大家解答了“如何进行富集分析”的相关问题,本期推送,小编则继续给大家介绍,获得富集分析结果后遇到问题如何通过调整参数来解决。
我们可以把富集分析比作“鱼塘里撒网捕鱼”。
鱼塘
就是富集的数据库,
网
就是富集分析的方法,捕的
鱼种
就是通路。
那这个问题就可理解为,捕的鱼太少或没捕到自己想要的鱼怎么办?这么一听,事情一下变得简单起来,我们可以:
没有捕到想要的鱼,可能是网撒的还不够大。所以我们要扩大富集分析的所用的基因集。
情景一:
原来采用的所有比较组的差异基因进行的富集分析,但差异基因筛选采用的是严格的FDR≤0.05,现在可以调整为P≤0.05值筛选,以便获得更多差异基因。
情景二:
原来用的比较组的/趋势分析某个模块的/WGCNA分析某个模块的差异基因来进行富集分析,现在可以调整为用全部基因来进行分析。
捕鱼时,那些大鱼种(显著性的通路)更容易被捕获,而小鱼种(相对不那么显著的通路)则可能会在严格的阈值筛选下逃脱。因此,我们要缩小网眼(放宽阈值),防止遗漏小鱼。
情景:
原来用严格的FDR≤0.05没有筛选到想要的富集通路,现在可以换成P≤0.05筛选。
每个鱼塘的生物组成都是不一样的,若你想要的是鲈鱼,是不是应该去鲈鱼比较多的鱼塘去捕,可能性才会更大呢。因此,在以上办法都没钓到想要的鱼时,不妨换个鱼塘试试。
情景:
原来只关注的GO和KEGG富集分析的结果,现在可以尝试用下DO、reactome和DisGeNET等数据库。(基迪奥OM平台都有提供哦)
渔民会根据不同的鱼类来改变捕鱼的时间和地点,如在夜间或黄昏时捕捞鲈鱼,在低潮时捕捞蛤蜊和牡蛎。同样的,我们可以通过改变富集分析的策略来获得目标通路。
情景:
原来你可能使用的普通的富集分析,而它就好像用一个固定大小和网格的渔网在湖中某个特定区域捕捞,如果你的目标珍稀鱼类不常出现在这个区域,或者体型大小不适合通过渔网的网格,你捕捞到的鱼可能就很少,甚至一无所获。
现在,可以尝试用GSEA富集分析方法,它就像是根据鱼类的活动路径和使用可变尺寸的渔网进行捕捞,更注重鱼群的整体趋势和顺序,从而提高了捕捉到目标珍稀鱼类的概率。
Omicsmart转录组报告中应对问题一的4种解决办法
理解问题一的解决方式后,逆向思维就可以解答问题二了:
方法1:
减少参与富集分析的差异基因数目,比如通过缩小富集分析筛选基因集的范围,比如只采用趋势分析中某个模块的基因;提高差异基因的选择标准,比如FC值≥2改成大于等于3,将P值更换成FDR值,或者将P≤0.05改成比0.05更小的值。
方法2:
对富集获得的通路,按FDR/P值对显著性进行排序,主要关注显著性靠前的通路。
有的小伙伴特别关注某些差异基因,可是它却没被富集在显著通路上,难道它就没有用了?
虽然我们撒网捕鱼(富集分析)捕获了许多常见的鱼种(通路),但总有一些特殊鱼种(特定差异基因),它们游得快、藏得深,或者数量稀少,使得普通的网难以捕捉到。然而,这些特殊鱼种的存在,可能正是维持鱼塘生态平衡(表型)的关键。我们可以进一步改进捕鱼技巧(分析方法)来了解这些特殊鱼种的价值和作用。
方法1:
进行目标基因PPI网络分析。利用STRING这样的蛋白互作数据库,探索目标基因编码的蛋白与其他蛋白质之间的物理或功能关联。这样可以帮助发现新的潜在通路或分子机制,即使这些通路本身并未直接富集你的数据中的差异基因。
方法2:
当用传统富集分析没能识别出重要通路时,可以尝试用GSEA富集分析。与传统基于阈值的方法不同,GSEA考虑了所有基因表达水平的变化,能够捕捉到那些单独看不明显但在整体上表现出一致变化趋势的基因集合。这种方法特别适用于检测微效但累积效应大的基因群。
方法3:
实验验证。对没被富集到的差异基因单独进行基因敲除、过表达或RNA干扰等实验,以观察它们在细胞或动物模型中的具体作用。
方法4:
文献调研。通过查文献了解该基因在其他研究中的表达模式、生物学功能以及参与调控的信号通路。
自从OM平台推出AI客服以来,我们一直有在收集“友友们”的问题,并尝试以推送的方式给大家解答: