专栏名称: 基因检测与解读
介绍基因检测新进展,探讨基因数据分析流程与方法,分享罕见病故事,科普基因知识,个人基因检测报告解读
目录
相关文章推荐
中国政府网  ·  第二场“部长通道”,3位部长回应热点问题 ·  昨天  
长安街知事  ·  习近平出席解放军和武警部队代表团全体会议 ·  2 天前  
半月谈  ·  宏观政策如何同向发力? ·  3 天前  
介个工作室  ·  阿里巴巴国际站 7 ... ·  3 天前  
介个工作室  ·  阿里巴巴国际站 7 ... ·  3 天前  
51好读  ›  专栏  ›  基因检测与解读

GeneMatcher:让对相同基因感兴趣的研究者匹配并建立联系

基因检测与解读  · 公众号  ·  · 2018-02-05 07:00

正文


在过去几年中,全外显子测序(WES)已经成为发现孟德尔单基因遗传病新基因的主要方法。在一个典型的WES中从数万个基因组变异中寻找到一个或两个致病性突变是一个很大的挑战。在临床WES的个体中,约75%不能确定致病变异,阳性率相对较低的原因包括遗传病临床表型差异较大、目前已知的疾病基因数量较少(约3400个,占总编码基因的15%)(游侠补充现在约有3900多个)、对检出变异功能的不确定性以及临床医生与基础科研人员缺乏有限沟通。广泛共享的、结构化、全面的表型数据以及寻找改进的特定候选致病基因的患者或模型生物对于WES的临床和科研分析至关重要。在这里,我们介绍GeneMatcher(http://www.genematcher.org),这是一个基于Web的免费访问的工具,旨在使来自世界各地的对相同基因感兴趣的临床医生和研究人员之间加强联系,目的是将基因与表型关联,并增加我们对这些罕见疾病的理解。

GeneMatcher几乎完全是在Python中以及几个Perl支持脚本开发的。 该网站是使用Django Web应用程序框架开发的,并使用MySQL作为底层数据库。 整个堆栈在运行Red Hat EnterpriseLinux的虚拟机上运行。 之所以选择Python是因为它是一种流行的,强大的语言,具有各种各样的外部库。GeneMatcher位于专门用于托管敏感的系统和数据的约翰·霍普金斯大学数据中心。

GeneMatcher不收集可识别个体特征的数据。在创建一个账户之后,该网站允许研究人员发布一个或多个基因(通过基因名称,Entrez或Ensembl-Gene ID),并将连接发布相同基因的研究者。 提交后自动完成匹配,两个提交者都会收到电子邮件通知,包括姓名,联系方式,电子邮件地址和匹配的基因等信息(图1)。


图1(原图就比较糊)


GeneMatcher最适用于还不清楚相关临床表型的候选基因。 鼓励提交者仅输入具有确认的候选致病变异的强候选基因(游侠补充:比如新发突变位点所在基因或符合复合杂合位点的基因),例如通过家系测序方法。遵循这两条规则将有利于寻找真正的新遗传致病基因。

更新

GeneMatcher于2013年9月启动,自此之后,来自49个国家539个提交者的2433个基因已经提交到数据库,并且已经产生了450个匹配,使来自不同国家和不同背景的临床医生和研究人员针对相同的感兴趣的基因产生合作(2015年7月1日)。在2,178个基因中,307个与动物模型有关。 提交的基因和匹配数量的增长如图2所示。



因为只有提交者才可以获得匹配的细节,所以我们只能跟进自己的匹配或者通过朋友私下交流获得。(游侠:好吧,你们的保密工作做的真好!)贝勒-霍普金斯孟德尔基因组学研究中心(BHCMG)已经提交了来自62个无关家族的180个候选基因。 我们至少有69个匹配,来自于43个基因和30个家庭。至少有16个匹配(9个新的孟德尔基因)也是表型匹配,其中有3个基因正在提交文章发表,分别是SPATA5,HNRNPK和TELO2。AP3B2基因上的匹配将人表型连接到具有相似表型特征的小鼠模型上。临床诊断实验室GeneDx也开始使用GeneMatcher,通过上传他们的3类基因(具有可能致病性变异的基因并且尚未与疾病相关),在临床医生和研究人员之间产生数十个匹配。

为了增强对临床和科研全外显子测序数据的解读,我们现在正在测试不同的算法以使用表型特征来匹配条目而不是候选基因。 这将能够识别来自世界各地以前没有描述过的罕见表型的个人。


讨论

GeneMatcher是作为BHCMG的一部分而开发的,因为我们需要鉴定在同一基因中具有罕见表型不同变异的更多个体,并与研究模式动物同源基因研究的基础科学家建立联系。对于WES项目中的许多患病家庭,我们可以筛选出一小部分候选变异,但是只选择一个候选基因就很困难。对于许多被鉴定的候选基因,特别是对于错义变异,对于它们的生物学知之甚少,基因敲除动物模型往往又没有。由于正在研究的大多数表型的稀有性,通过鉴定多个不相关的先证者在同一基因中的致病变异证明基因与表型的因果关系是一个挑战。一些特征可以用不同的术语来描述,许多畸形特征是主观的,这些特征的精确描述取决于临床医生进行评估时的个人经验。确定需要什么程度的表型重叠来鉴定相似的个体是具有挑战性的,并且可能因表型而异。出于所有这些原因,我们选择基于基因而不是表型来搜索匹配。通过基因搜索也不需要知情同意,因为不需要个人标识符,使得搜索过程更简单和更快。







请到「今天看啥」查看全文