专栏名称: 大数据实验室
宽客俱乐部旗下美国大数据实验室,大数据研究应用。
目录
相关文章推荐
软件定义世界(SDX)  ·  中信建投:DeepSeek如何加速金融业数字 ... ·  昨天  
数据派THU  ·  10²⁶参数,AGI还需70年!清华人大预测 ... ·  昨天  
数据派THU  ·  大数据智能学术论坛第一期 | ... ·  昨天  
51好读  ›  专栏  ›  大数据实验室

Y染色体上的证据,人类迁移路线图,中国人来自哪里?

大数据实验室  · 公众号  · 大数据  · 2017-06-27 08:57

正文

编者按:


现在公众号有置顶功能了,大家把微信更新到最新版本,点开“大数据实验室”公众号。点“ 置顶公众号 ”键,就可以置顶了,这样。不管我们什么时候更新,您都能容易找到。



刚按:视频中,李辉博士用进化论的理论解释 人类走出东非之前的变化,这并不能代表所有人的观点,特此说明。

中土文明原来自南而来?汉人和藏人的关系居然比汉人和越人、汉人和苗人的关系更为接近?福建地区的居民大多数是北方汉人?这些问题的答案居然隐藏在一门崭新的学科:分子人类学之中。


“这些历史信息隐藏在我们体内的DNA分子结构里,至少到目前为止,历史学家的不少推测被证明是错误的了。分子遗传学在一次次地证明着这点。”李辉在复旦大学生命科学学院攻读博士学位。研究方向是分子人类学,他热衷收集中国及东南亚地区各个民族分支的DNA样本,足迹遍及中国南部的城镇与村落。


“民族更多是一种政治学上的概念。语言学家的分析相对有客观性。你知道吗?语言学里面一些最隐晦、最古老的脏话是测量的依据,这和分子人类学根据随机突变DNA研究人类迁移的依据一样。”李辉说,所以,现在分子人类学和语言学在一起推测着人类的族群变化和迁移。


由IBM赞助,美国《国家地理》杂志举行的研究“人类迁徙遗传地理图谱计划”2005年4月开始在世界各地进行,复旦大学生命科学院承担了远东地区及其东南亚地区的DNA的取样和研究,正好有大量充足的基金来研究这地区的人类迁移路线?实际上也就是人类的文明走向,正好证实或证伪若干历史学家的推测。


“人类迁徙遗传地理图谱计划”在全球范围内收集10万份人类DNA标本,用5年时间描绘出史前人类迁移的路线。“这次我们调研的重点将是绘制一幅中国人祖先迁移的地图,用来探究我们民族和语言等诸多进化环节当中的未知问题。”负责这个项目的复旦大学生命科学院院长金力教授说。


汉藏同源,吴越不同


汉人和藏人本出同源,分子人类学家根据研究DNA得到了这一结论。而且,汉人与藏人的关系比苗人、越人的关系都要更接近。 汉人和藏人的分开不过是5000年前的事情。


最早提出汉藏同源的是中国的一些语言学家。原本语言学界认为南方的侗傣语和汉语最接近,后来发现与汉语最接近的是藏语。藏语中大多数字的发音在中国东南部的方言中都能找到,而且字义相同。藏语和汉语之间存在的不是一般意义的对应关系,而是系统性的一一对应。在语言学上,汉族和藏族表露出非同一般的关系。


中科院昆明动物研究所研究员宿兵于1996年在DNA中找到了汉藏同源的证据。他发现汉人和藏人在M122以及在其分支M134上都有相同的突变。而且宿兵通过对Y染色体主成分进行分析,发现藏族的突变频率与汉人最接近,这意味着在藏缅语系的诸多民族中,藏族和汉族最接近。他们分化的年代约在5000年前。


M122突变大约发生在三四万年前,那时中国陆地上的许多山脉被积雪常年覆盖。棕色人种早于黄色人种在黄河、长江流域活动,在东南亚的缅甸一带,黄种人的部落已经取得一定势力,棕色人不断沿海岸线退缩,或者躲进山区。“当中国陆地上的冰川不断消融时,一支带着M122突变的南亚语人群开始进入了中国。”李辉说,目前发现关于南亚语先民进入中国后的分化路线有3条,共有两个入口,一个是在云南,一个是珠江流域。


其中一支沿着云贵高原西侧向北跋涉,他们最终在距今1万年前的时候到达了河套地区,黄河中上游的盆地。“这里应该是中华文明的真正起源地。”汉藏语系的祖先也被后人称之为先羌,他们也就是汉族与藏族人的祖先。


这一支南亚人在出发时头颅还很圆,带有大鼻子、厚嘴唇等特征。但在他们行进过程中,人体形态发生变化。而到了高原之后,不再受疟疾影响,加上缺氧,存活下来的人基因变化了,脸都变得很长,线条、棱角变得刚硬,如同刀削。留在河谷地区的羌人应该是迁移过程中留下的。他们保留了游牧的习性。


经过这1万多年的迁徙,这样一直到5000~6000年前,人体内部的DNA又开始不安分了,那时,由于粟谷农业的出现,新石器文化开始在这个地区发展。人口的增长使群体必须扩增新的居住地。汉藏语系的两个语族开始分野。其中一个亚群在M134的基础上又发生了M117的突变。他们带着这个突变向东行走,一直到渭河流域才停留下来。他们掌握了农业文明,开始以农耕为生。这个群体就是华族,也就是后来所称的汉人的前身。“M117是汉人身上很古老的一个遗传突变。”李辉说。


另一个亚群被称为藏缅语族群体。他们或是战败、或是寻找食物离开黄河流域,向西向南迁移,最后在喜马拉雅山脉南北居住下来。在迁徙的过程中,这个群体就像细胞在不断裂变,分化出了藏、彝、景颇。至今,这些民族的送魂歌中都要把亡灵送回北方。“藏族在形成中吸取了中亚的许多因素。”


华夏族扩张很厉害,他们向四面掠夺土地和粮食,羌族这时候不再被他们认做是同类,称其为“西戎”,当然也包括东部的广泛地区,但这一地区已经被“三苗”占领,这是和汉藏同一祖先而更早迁移到此的族类,部族的争斗产生了民族英雄,“黄帝”就是这样的人物。而后,华族和东夷、南蛮在夏商阶段一直在争斗中。“楚人是荆蛮的后代,从荆蛮里面分化出三苗,所以,现在分子遗传学可以看出,很多湖北人DNA和苗人的关系接近,胜过与汉人的关系。”李辉说。


百越先于汉藏进入两广地区,穿越南岭的变为北越,也就是后来越国的祖先,南方的越人自秦汉以来一直往广西山区迁移,南宋时候又发生迁移,后来形成侗族。所以,现在浙江一带越人的语言和侗族语言有相同之处。而吴国人则有不同的起源,吴越两国根本不同源,统一使用华语后才接近。历史学的猜测再次失败。


当初南亚先民从云贵高原西侧进入中国后,一支人群与汉藏民族分开而行,他们沿着长江往下走,这个人群在洞庭一带形成了苗瑶语系。“吴人就是苗瑶人东进和南下的汉人同化后形成的,所以他们遗传结构的变化多而复杂。”


在渭河流域华夏族逐渐磨砺出一支骁勇善战的“”秦人“”,他们盘踞在关中,积聚着统一中国的实力,秦汉时期,四分五裂的中国被统一,从语言、文字到货币、计量单位等文化层面上,汉族的整体意识真正形成。加上强有力的中央集权统治,之后汉族就没有再出现分化。而且,各地的汉族基本没有带上外来的成分。他们通过先进生产力而不断地扩张,占据了大部分土地。


“历史学家说的汉人扩张中不断融合当地人是不对的,当地人基本被驱逐了,福建人是最好的证明:根据分子人类学分析,他们基本上是北方汉人的后代,语言上保留古代汉语尤其多。”李辉说。


金力教授的实验室助理钱吉说,其实中国在利用DNA分析自己祖先的迁徙路线上已经相对比较成熟了,就目前的研究成果来看,华夏56个民族和东亚东南亚各民族都是由南亚语系的先民分化出来的,因为他们身上都带有M122的突变。


弄清祖先迁移路线


李辉着重研究的是在中国南方的各个民族群体间的关系,“因为人类是从东南亚地区进入中国的,所以在中国南方他们生活的时间长,分化的人群也就多。而且那么多人群聚集在一起,不停地在进行分化、同化,千万年后的我们根本就不知道自己所属哪个人群”。


李辉在注册登记时,民族栏里填写的是汉族,但是他从小时候就发现自己虽然居住在上海奉贤,但和周围的汉族人在文化习惯上有很大差异。他太爷爷太奶奶有自己深青色的民族服装。他们有自己的节日,农历四月十八日,他们会洒水过新年;农历九月十八日,他们会把鱼塘里养的鱼都捉来,斩成段,分成堆,每家每户平均分配。当时,长辈们给李辉的说法是,他们就是上海最早的原住民。


直到李辉到云南傣族去采样时才发现,傣族的语言他几乎都能听懂,他发现在词根上傣族话和他所说的话完全一致,只是在词缀上有些变化。而到了水族,李辉更为惊讶,连那儿的悄悄话、私房话,他都能听懂。回到上海后,他就研究了自己的DNA,经分析发现,傣族、水族和他自己身上都带有M119突变。


经过研究,李辉发现,南亚先民沿云贵高原西侧北上形成汉藏语系的同时,从中分离出一支南亚先民朝东南方向迁徙,绕过老挝的崇山峻岭,距今1万多年前,南方的北部湾形成了澳泰语系祖先。这一支黄种人带着M119突变从越南和广西方向进入中国,沿着海岸线往东北走,形成了百越民族。


李辉通过检测自己的Y染色体和线粒体(均属随机突变DNA),发现它们来自现今的广东福建一带。通过DNA检测,李辉才知道,他们属于澳泰语系中的一个人群,而他所说的一些话来自一种古老的澳泰语。这个语系祖先的形成是在2万多年前南方的北部湾。


澳泰语系人群在民族学上又称为百越民族系统,他们历史上的覆盖范围是从越南北部的交趾分布到江浙一带。在千百年的分化中,诞生了黎族、侗族、水族、仫佬族、仡佬族、高山族、壮族、傣族。这些民族在语言、文化上有很强的一致性,所以也统称越人。“你看我的眉骨向下弯曲的弧度很大,这就是澳泰语系人群的显著特征。”李辉说。


钱吉说,在此次“人类迁徙遗传地理图谱计划”中涉及到关于中国人迁徙路径的研究只需要做些收尾和补充工作。比如如今有研究发现,在2万多年前,澳泰语系形成的时候,就有一支部落沿着海岸线往上跑。他们几乎就没有留下沿途停滞的痕迹,一直跑到西辽河流域再停留下来。他们是阿尔泰语系的核心。之后那些阿尔泰语系的先民又朝周边迁徙,往西分化成蒙古、突厥,往东进入朝鲜、日本,向北穿过白令海峡踏上美洲。“但是到目前为止,该语系的人怎样迁移还没有结论,这个地区的DNA采样相对做得薄弱些。在这一次的遗传地理图谱计划中,这些都会加以完善。更多的重点将放在对东南亚的研究上。”


复旦大学可能会先从老挝、缅甸入手,因为那里还有很古老的人群部落,“这次人类迁徙遗传地理图谱计划的工作重点将会落在老挝缅甸身上,毕竟,南亚先民是东亚人共同的祖先。这部分人群的遗传结构搞清楚了,将会对整个人类迁徙历史提供很大的贡献。”复旦大学该领域的科研能力目前在远东地区最强,他们此次研究将使每个人基本能弄清自己祖先的迁移路线。


全球携手绘制人类迁移图

人类基因图谱证明:人类无种族之分

美国最早宣布破译人类基因密码的塞莱拉公司负责人万特博士最近指出:“种族是一种社会概念,而不是科学概念。基因图谱并未显示‘种族’之间有何差异。我们都是10万年前从非洲的少数原始部落迁移和进化而来。”万特博士与美国国家卫生总署的科学家们日前宣布,他们已经研究了人类全部基因排序的草图,他们一致认为,人类只有一个种族。

事实上,科学家们早就怀疑,被社会所承认的种族之分并不反映在基因的范畴内。特别是在对基因的研究越来越深入并接近完成基因图谱之际,大多数科学家开始相信,区别人类种族的那些标准实际上与生物学概念几乎没有什么直接的关系。他们说,区别不同种族最常用的特征,如皮肤和眼睛的颜色、鼻子的宽度等,是由相对而言极少数的基因控制。10万年时间只是历史长河中的片刻,在这短暂的人类进化史上,这些基因的变化是为了适应环境所带来的巨大压力,例如,赤道地区的人皮肤黝黑,是为了减少紫外线辐射的伤害;而北方地区的人皮肤白皙,是为了在较弱阳光下人体能产生较多的维他命D。纽约曼哈顿北区总医院院长佛理曼说:“如果你一定要问人的外表不同反映出多少基因组的差异,我的回答是:不到0.01%,这只占基因总图谱极小极小的一部分。”

亚特兰大艾摩利大学医学院分子遗传学教授华莱士说:“不幸的是,人类特别关注外表细节的差异,夸大所谓‘种族’差别的意义,似乎我们整个社会的结构都建筑在视觉的基础上。”

科学家们认为,与极少量基因决定人的肤色和外表相反,人的智力、艺术天赋和社交能力等却由人类8万个基因中数千甚至数万个基因所决定,而且是以复杂而相互关联的方式起作用。科学家们还发现,生活在同一地区的人,某方面基因的差别之大可达90%,而因生活地区不同而产生的基因差别只占10%。有些基因,例如控制免疫系统的基因,在人与人之间差别极大,可是这种差别与种族没有任何关系。

加拿大安大略省的印度裔生物学博士安南德建议,在研究人种时,与其去考虑种族不同,不如从临床的角度去寻找某一种群体易染上何种疾病,例如印度人形成血栓的几率较高,这也许是因为印度的文化和人们的生活习惯增加了引起心脏疾病的危险。所以,在考虑人种时,应从生物学的角度,全面考虑他们的生活方式、饮食习惯等,而不是强调他属于哪个种族。

但也有少数生物学家对此持有异议。犹他大学人口遗传学家罗格斯就认为,种族划分是有意义的。他说:“我们也许相信种族之间的区别主要表现在表面上,但差异确实存在。种族分类对于研究人类的起源和迁移过程有很大帮助。”



全世界人口基因来自36个女人 源于“线粒体夏娃”?


中国人常讲同姓氏的人“五百年前是一家”。英国牛津大学人类遗传学家经十几年的DNA研究发现,全世界的人口分别繁衍自36个不同的、被称做“宗族母亲”的原始女人,其中非洲有13个“宗族母亲”,印度、澳大利亚、中亚有7个。而 所有这些“宗族母亲”又都是15万年前到20万年前非洲大陆上一个科学家命名为“线粒体夏娃”(Mitochondrial Eve)的女人的后代。 尽管“夏娃”不是当时惟一活着的女性,然而她却是惟一一个将血脉延续繁衍到今天的原始女人。


据英国《每日快报》报道,该理论是由英国牛津大学人类遗传学教授布赖恩·西基斯(Bryan Sykes)提出的,他是世界上第一个发明从年代久远的古代骨骼中提取出DNA方法的遗传学者,并建立了“牛津祖先”(Oxford Ancestors)项目。

西基斯教授研究发现,现代欧洲人其实大多数都是远亲:97%的现代欧洲人,其实都起源于10000年前到45000年前冰河时代的7个不同女人,这7个“宗族母亲”被他称做是“夏娃的7个女儿”,7名原始女人通过“线粒体DNA”和现代欧洲人联系到了一起。线粒体DNA是只通过母系一脉传递的遗传基因,男性也能从母亲那里继承线粒体DNA,但却无法将它遗传给自己的后代。也就是说,如果一个女性生下的全都是儿子,那么她的线粒体DNA遗传链将因此终止。所以,如果一个女人没生出女儿,那她就真的断子绝孙了。

西基斯称,“很显然,在漫长的冰河时代,欧洲并非只生存着这7个女人,同一时代生活着大量的原始女性。然而她们要么没有长到成年,要么没有生下孩子,要么生下的全是男孩,但这7个原始女人不仅活了足够长时间,并且每人至少生了两名女儿,从而开始了线粒体DNA遗传链,并且一直延续到了今天。


据西基斯教授称,线粒体DNA一般很难发生改变,平均要过2万年线粒体DNA才会发生微小的变异。他对记者道:“研究发现,大多数现代欧洲人的线粒体DNA可分为7种类型,就仿佛血型一样。我们相信,每个线粒体DNA相同的人都是数万年前同一个女人的后代。”

西基斯承认,研究人员也偶尔发现有的人DNA不属于任何一个宗族母亲。他开玩笑地说,或许来自外星人吧。”

如果你想知道自己的“宗族母亲”是这36位中的哪一个,180英镑就可以搞定,上网联系“牛津祖先” www.oxfordancestors.com。已有二万人在“牛津祖先”的帮助下认祖归宗。

不仅母系能确认,通过Y染色体,父系一样有迹可循。研究发现,Y染色体的遗传轨迹与人的姓氏息息相关。例如20%叫麦当劳的美国人是“宗族母亲”的直接子孙。说不定,科学家不久还会发现人类之父“Y染色体亚当”呢。


基因研究揭示人类迁移中国人祖先源于东非

世界多个国家的科学家们正在合力完成一项庞大的人类寻根计划,希望通过研究人类基因的变异来绘制出一幅“人类迁移图”。

中国科学家的研究表明,中国人的祖先源于东非,经过南亚进入中国。这支南亚先民经过多次迁徙及体内基因突变,逐渐分化成为各个民族。

按科学家的观点,通过个人的DNA样本分析,每一个中国人都能了解自己的故事,寻找到自己的一脉渊源。

我们是谁?我们从哪里来?

“这些历史信息隐藏在我们体内的DNA分子结构里。”李辉说。这位复旦大学生命科学学院博士生热衷收集各个民族分支的DNA样本,并着重研究中国南方的各个民族群体间的关系。

李辉生长在上海郊区奉贤,通过检测自己的Y染色体和线粒体,发现它们来自广东福建一带。而在2万多年前,这些DNA类型在东南亚的北部湾活动。李辉从小说“飞”的时候是念“bóng”,和侗语“ben”很像。

很长一段时间,他一直以为这就是奉贤话。通过DNA检测,李辉才知道,他所说的一些话来自一种古老的澳泰语。这个语系祖先的形成是在2万多年前南方的北部湾。

科学家们一直在尝试着用DNA分析和电脑技术研究人类历史,从而确定人类种族及人类社会的形成过程。这项工作从未间断过。目前,一项庞大的人类寻根计划在全球展开。新华社4月18日的一则电文说,为了全面了解人类的起源与迁移过程,以及人类数千种语言的形成,在未来几年内,我国科学家将和美国等国的科学家一起,通过研究基因的变异以绘制出一幅“人类迁移图”,从而填补人类历史认识的空白。

这项为期5年的项目被称为“人类迁徙遗传地理图谱计划”。这一项目将通过分布在中国、俄罗斯、印度、巴西等地的10个实验室和大学的专家来共同完成。科学家们将在世界各地采集不同人种的10万份DNA样本进行分析。

复旦大学现代人类生物学研究中心主任金力教授和他的团队负责东亚和东南亚地区的人群研究,内容包括东亚和东南亚的人群迁移、民族和语言的产生和分化、人群间的基因交流等。

“这次我们调研的重点将是绘制一幅中国人祖先迁移的地图,用来探究我们民族和语言等诸多进化环节当中的未知问题。”金力教授说,此次要采集大约2万个DNA样本。每一个中国人将能了解自己的故事。

北京猿人不是我们祖先

“我们的祖先究竟是谁?”初中教科书的权威教育是,分布在中国的现代人是由生活在40万年前的北京猿人进化而来。这个说法的理论依据是人类的多地区起源说,认为在欧、亚、非的现代人都是由当地的猿人进化而来。







请到「今天看啥」查看全文