专栏名称: 基因检测与解读
介绍基因检测新进展,探讨基因数据分析流程与方法,分享罕见病故事,科普基因知识,个人基因检测报告解读
目录
相关文章推荐
环球物理  ·  【高考物理】这16大解题技巧很实用! ·  2 天前  
环球物理  ·  【天宫课堂】“太空授课”考点汇总 ·  2 天前  
中科院物理所  ·  SECUF-2025第一轮会议通知|第四届综 ... ·  2 天前  
51好读  ›  专栏  ›  基因检测与解读

小技巧 | 二代测序数据分析小心新发突变假阳性

基因检测与解读  · 公众号  ·  · 2017-08-19 12:06

正文

背景介绍

随着测序成本的下降,临床一家三口trio全外显子或医学外显子已经逐步普及,至于说首选先证者全外显子还是一家三口全外显子这涉及到卫生经济学,还与涉及的疾病以及数据分析能力密切相关,这里不详细讨论,如果仅从数据分析角度来说,trio分析阳性检出率要高于单人全外显子,一方面是可以直接检测出新发突变(de novo突变),另一方面从隐性遗传模式分析可以直接分析出复合杂合突变与纯合突变分别来自父母。

 

但是在分析新发突变时,生信人员要特别小心,根据游侠的分析经验,通过GATK直接分析出患儿携带而父母不携带的新发位点99%都是假阳性,我们知道每个人在基因编码区(可以认为是全外显子测序)新发突变一般不超过3个,而用软件call出来的新发突变一般都有数百个。


那么为什么会出现那么多假阳性位点呢

个人认为主要有以下几点原因:

  1.  有些区域为序列重复区,本来二代测序在该区域就不准,导致患儿的突变丰度在10%以上,而父母在10%以下,而根据GATK标准分析流程call的标准为10%,所以患儿检出而父母未检出导致假阳性,这一类最多见;


      2.  全外显子有些区域患儿与父母覆盖不一 致,比如患儿在这个区域有个杂合突变,而父亲或母亲在该区域没有覆盖,导致假阳性;


       3.   如果父母与患者不是同一批捕获测序,也会出现一些系统误差导致的假阳性;


        4.   由于比对错误导致的假阳性,这种时候比对上的可能只是reads的一部分而不是全部;


如何解决这一难题呢

     1.       需要在IGV软件中查阅具体的位点情况,特别是新发位点附近reads的比对情况,以及父母是否存在低比例的突变reads,这里面还有一个比较棘手的问题:是否在该位点父母有低比例的突变reads就可以排除这个位点呢?答案是否定的,目前发现有20%的子代新发突变都是由于父母的低比例嵌合突变导致的,所以在这种情况下完全可以解释父母表型正常,综合来说要结合患儿及父母的突变比例以及疾病的表型特异性来判断;


       2.     新发突变需要对患儿及父母做一代测序验证,双向测序,即使做了trio全外检测;


        3.   患儿样本需要与父母同一批建库测序,使用相同的数据分析流程;