专栏名称: VG生信软件
国内首家从事Windows平台、可视化生物信息学桌面软件开发的公司。致力于提供领先的生物信息学软件产品和系统服务。产品和业务包括:微生物多样性分析软件、转录组分析软件、重测序分析软件、细菌基因组分析系统。
目录
相关文章推荐
湖北省教育厅  ·  开学就实施!该地中小学生每天综合体育活动时间 ... ·  21 小时前  
湖北省教育厅  ·  开学就实施!该地中小学生每天综合体育活动时间 ... ·  21 小时前  
科研大匠  ·  无限使用!ChatGPT学术中文版入口 ·  2 天前  
募格学术  ·  社科研究必学!Python文本分析课程来袭, ... ·  3 天前  
研之成理  ·  Angew. Chem. ... ·  5 天前  
51好读  ›  专栏  ›  VG生信软件

转录组测序常见问题整理

VG生信软件  · 公众号  ·  · 2018-01-24 17:32

正文



转录组测序结果与qPCR验证结果不一致,Why?


  • 两种方法本就不同,RNA-seq是大规模筛选用的,反应样本整体的基因表达变化趋势,无法保证每个基因的变化趋势都与qPCR一致。存在一定量的不一致也属正常

  • 实验样本搞反

  • 挑选的基因表达差异不显著,或挑选的是差异基因但表达量较低

  • 没有使用与RNA-seq同一批样本进行验证



真核de novo转录组项目,想挑选差异表达基因做验证,是优先考虑差异倍数大的基因还是在六大数据库中均有注释信息的基因?

注释到的基因数与研究物种及选用的数据库有关,现有数据库中关于该物种及其相近物种的注释信息越全,则注释率也会越高。

NR数据库作为NCBI主要数据库之一,库容较大,能注释到较多的基因,但 注释到的基因 中未验证的信息也较多,且很多基因功能描述模糊,会影响我们对基因功能的辨识。因此,结合其他数据库注释结果综合考量更为妥当。验证实验需结合具体的生物学意义。

差异基因较多时,可通过功能注释缩小筛选范围,且挑选差异倍数大、表达量较高的基因来验证,成功率会较高。



能否只提取脂肪代谢相关的基因的部分基因做差异分析?

差异分析是基于整体来做,要用全部read count进行差异分析。

若提取部分基因做分析,会破坏数据的整体性,如 reads分布特征 、测序深度等,所以不建议提取部分基因做差异分析。



某基因在两个样本中表达量差异很大,分析结果却是非显著差异基因,为什么?

差异基因的筛选基于统计学,不能仅通过某个基因在两个样本中表达量数值的大小,判断差异表达是否显著。

差异显著情况可通过矫正后的p-value来看,矫正后的p-value越小,差异越显著。

也可结合|log2Foldchange|值来判断差异的大小,|log2Foldchange|越大,差异倍数越大。



RNA-seq分析中几种表达量计算方法有何不同?

  • FPKM

    与RPKM极为相近。区别仅在于 Fragments Reads

    RPKM主要针对早期的 单端 SE )测序,FPKM是在 双端 PE )测序上对RPKM的校正。

    Reads是测序数据中的每一条Reads,Fragments是每一段用于测序的核酸片段(建库时打断获得)。

  • RPKM

    为每百万Reads中,每个基因以一千个碱基为单位,比对上的Reads数。

    计算公式:RPKM=(1000000*C)/(N*L/1000)

    C 为比对到gene A的reads数,N为比对到所有gene的总reads数,L为gene A的碱基数。

    RPKM法能消除基因长度和测序量差异对基因表达量计算的影响,计算得到的基因表达量,可直接用于比较不同样品间的基因表达差异。


  • TPM







请到「今天看啥」查看全文