1953年1月18日,英国物理学家弗朗西斯•克里克和美国年轻的生化学家詹姆斯•沃森合作,提出了脱氧核糖核酸(DNA)分子结构的双螺旋模型,即著名的“沃森-克里克模型”,这一发现揭开了分子生物学研究的序幕。
随后70年代到80年代初期,随着生物化学技术的发展,产生出大量的序列数据,而在这个阶段数学统计方法和计算机技术都得到较快的发展,于是促使一部分计算机科学家应用计算机技术解决生物学问题,特别是与生物分子序列相关的问题。他们开始研究生物分子序列,研究如何根据序列推测结构和功能。这时,生物信息学开始崭露头角。
在这些想要用理论来解释地球上所有生命现象的科学家中,其中就有唐元华。原本一直学习数学的他决定“转行”进入生物学,这中间还有非常有意思的契机。1988年唐元华博士去美国学习生物统计学,恰逢詹姆斯•沃森到其学校演讲,介绍即将开始的 “人类基因组计划” 。唐博士听完这个被誉为生命科学的“阿波罗登月计划”后,非常震撼。早在大学时期,唐元华博士就一直关注生命科学,还组织过关于生命科学的讨论班。他的梦想是用一套理论系统去描绘生命科学。如今实现梦想的机会就在眼前,于是他毅然决然地改换专业,自此全身心投入到了生物学领域。他重新从生物学的本科开始读,一直读到医学院的博士后,把自己打造成为一个真正懂得生命科学的学者。唐元华博士对自己身份的定义是“生物信息学家”,在计算机领域是0和1,在生命科学领域就是ATGC,生命的本质就是信息。
毕业以后,唐元华全身心投入到人类基因组项目中。1996-1999年,他在美国加州的一家遗传学数据公司Incyte 工作,带领团队发现了超过6000个人类基因。1999-2004年,在Nuvelo 又领导团队发现2000多个基因。目前人类基因组约有三万个基因,其中编码蛋白的传统意义上的基因大约两万多个。保守估算,唐元华领导的团队发现超20%的人类基因,他也是世界上发现人类基因最多的科学家。回想起这段经历,唐博笑着说,自己当时因为太过“沉迷于”发现新的基因,周末都会到公司工作,甚至差点错过家中二宝的出生。直到太太打了很多通“催促”电话,他才急急忙忙地赶回家,结果到医院不到半个小时,宝宝就出生了。对于唐元华来说,每天都能发现新的基因和基因家系,还可以自己命名,这是非常有成就感的。他希望,有一天可以用基因组来指导管理健康和治疗疾病。
2013-2015年期间,因为工作的原因唐元华被派到华大基因,这期间他不断往返于美国和中国。当时国内的生物信息学已经快速发展,研究领域很宽,但与国外相比,深度上略有不足。直到1000美元全基因组测序的实现,唐元华看到了巨大的机会,他觉得是时候把基因组应用推向普通大众了。其间,他和国家人类基因南方研究中心的赵国屏院士探讨了做人口基因数据库研究的可能性,并做了多方面的调研。2015年,他与同来自于美国硅谷的徐健博士一起,带领团队,在苏州BioBAY成立了致力于成为中国基因大数据领导者的首度基因公司。
唐元华博士介绍说,首度基因是一个数码生命与基因大数据公司,其目标是将将基因测序信息,转化为人类追求健康和战胜疾病的福音。首度基因以癌症的基因检测为起点,中期目标是建立中华人种的胚系遗传大数据库,为全体国人提供基因产业的服务。首度的长期目标,是大大提高人们的健康生命周期。
创立之初,首度基因就开始打造国内权威的癌症基因信息数据库,即“中国癌症基因云平台”,创建有统计意义的华人常见癌症变异和治疗效果基线。目前,癌症云平台已经完成1000多例癌症病人的测序、和1000多例的健康人对比数据,正在进一步积累数据中。癌症云平台是免费开放的公益数据平台,可为广大癌症基因组学研究者们提供免费的云存储、数据分析流程、数据库资源等服务。唐元华博士表示,我们希望通过免费开放互相交流,来共同推进癌症基因领域分析研究的发展,不断完善有助于患者治疗的癌症基因大数据库。
基因蕴藏着所有生老病死的规律,通过基因可以对未来可能患的疾病进行预测和预防,对人类健康的指导意义显而易见。《2015中国癌症统计数据》显示,2015年中国大约有429.2万例癌症新发病例,281.4万例因癌症死亡。按照平均寿命74岁计算,人一生中罹患恶性肿瘤的几率高达22%。
唐博士介绍到,癌症是先天遗传和后天环境协同作用的结果,肿瘤基因的遗传并不必然导致癌症的发生。有些外表健康的父母,因为携带肿瘤基因,会生育出发生疾病的子女。拥有肿瘤基因的家族,癌症的发病率会远远高于正常水平。如果针对这些高风险人群,进行遗传性肿瘤的早期筛查,就可以做到早预防、早干预、从而降低肿瘤发病率和死亡率。基于这样的想法,针对癌症基因筛查的首度基因的FD-FIRST(首度-福思特)研发了出来。它可以全面筛查客户的遗传性肿瘤风险。如果在中国市场上推广,每年可以拯救几十万人的生命。此外还有针对全外显子测序的FD-ExomeTM,可通过高通量基因测序和基因大数据分析技术,扫描人体内3万个基因的全部外显子区域,综合分析19大类疾病及8大类非疾病遗传风险等内容。
未来15年内,基因组学就会像现在的手机一样普及,每个人都可以拥有自己的基因组数据,来了解自己的健康状况,唐元华预测到。医生也可以根据基因组数据制定个性化健康管理方案。当然,对普通老百姓来说,要读懂这本“生命天书”,还需要基因咨询师的帮助。目前我国基因咨询师也十分空缺,急需培养这方面的人才。
对于公司接下来的规划,唐元华博士表示,一如其初衷,首度基因将通过建立基因大数据库,为大众提供基因信息服务,最终指导管理健康、治疗疾病,提升人们的健康生命周期。也希望未来行业能够在深度上有所发展,多看到一些“小而精”的产品,这样才能有益于整个行业的健康发展。
本文系生物探索原创,欢迎个人转发分享。其他任何媒体、网站如需转载,须在正文前注明来源生物探索。