背景
一直以来,社会学传统的主流理论强调个人在社会结构中的位置以及社会环境结构对个人的作用,因此社会学研究专注于由环境差异导致的能够被观测到的个体差异,比如认知发展,教育/职业成就,生育状况,健康状况和健康行为。由于缺乏对个体遗传特征差异的探测技术,基因遗传带来的固有差异在社会学研究中长期以来被归为不可控的变量, 由此对统计模型估计造成的误差在社会科学研究中被认为是无法从根本解决的问题。为了准确理解社会环境对社会行为的影响,遗传因素对个体特征和行为的作用是不可忽略的。本文将简单介绍几篇探索社会行为遗传基因的文章,并讨论这些研究成果被运用在社会科学研究中的可能性。
一.全基因组关联分析 (Genome-Wide Association Studies)
随着人类基因组计划测序完成和分级遗传学技术的快速发展,全基因组关联分析(简称GWAS)应运而生。GWAS是指在指在人类全基因组范围内找出存在的序列变异,从中筛选出与表型性状相关(phenotype)的单核苷酸多态性(SNPs)。表型是与基因型相关的性状,例如身高、血型、智力等。这种方法在研究之前不需要构建任何假设,可以直接研究全基因组水平的遗传变异。最早应用于人类研究的GWAS发表于2005年,由Klein et al (2005) 发现complement factor H 基因与具有年龄相关性的黄斑变性病显著相关。随后,GWAS开始被大量运用在人类复杂疾病方面。近年来每年发表的GWAS数量呈指数增长,从2007年前的寥寥无几到2013年发表的将近2000篇报告。在遗传学和病理学领域,GWAS报道了与心血管疾病、肥胖、2型糖尿病、阿兹海默症等疾病相关的遗传变异(CARDIoGRAMplusC4D Consortium 2015;Frayling 2007; Lambert 2013; Loos and Yeo 2014)。如今,随着大量的社会调查开始收集血液和唾液从而获取DNA样本,表型已不仅仅局限于生物性状和疾病,而被拓展至个人属性、特征和社会行为。本文选择了两篇代表性文章做介绍。
(1)遗传变异影响受教育程度 (Okbay et al 2016)
一项涉及30万人的GWAS,发现了与受教育程度相关的遗传变异。这项研究于2016年发表在《自然》杂志上。 传统社会学认为个人教育水平很大程度上受到社会和环境因素的影响,但越来越多的证据表明,教育水平一定程度上也受遗传变异的影响。这项研究用个人受教育年数(years of education)衡量教育程度,报告了74个与受教育程度相关的SNPs。他们发现在胎儿时期,这些遗传变异所在的区域中的一些候选基因会在神经组织中优先表达。这些基因在神经生物学发育的生物同路中会获得强化。值得强调的是,这些遗传相关性只能解释受教育水平中的很小一部分差异(约3%),大多数差异仍是主要取决于环境。
(2)遗传变异影响生育 (Barban et al 2016)
研究人员发现12个与初次生育年龄和子女数量呈显著相关的遗传变异。这项牛津大学主导,荷兰的格罗宁根大学和瑞典的乌普萨拉大学参与的研究, 分析了来自62个数据集的238,064例男女的第一次生育年龄, 以及将近33万例人群的子女数量信息。人类生殖行为曾一度被认为主要由个人选择,社会和环境因素决定, 然而这项最新的研究显示遗传变异的影响可以被分离,且生育行为具有生物基础。 这篇论文由来自世界多个机构的250多名社会学家,生物学家和遗传学家共同协作,研究结果发表于《自然-遗传学》杂志(Nature Genetics)。研究的第一作者,牛津大学纳菲尔德学院和社会学系的Nicola Barban表示:“我们的基因不能决定我们的行为, 但我们的研究第一次鉴别出部分可以影响行为的遗传密码,这帮助我们在理解人类行为的征程上又前进了一小步。” 研究计算出,12遗传位点的基因变异总共解释了低于1%的第一次生育年龄以及子女数量的个体间差异。文章指出,尽管遗传变异的影响微小,然而将模型合并后,基因变异可以解释9%的女性不生育概率差异。研究人员同时还猜测部分位点会影响到性激素的分泌或者与不孕不育有关。进一步了解这些基因的功能将为不孕不育的治疗提供新的视角和认知。
二.遗传信息的社会学领域运用
社会学家致力于通过将遗传学引入社会学中,根据分子遗传学的研究成果来改进社会科学的研究模型,这样的思考方法衍生出了一个新兴研究方向:遗传信息社会学(胡文 etal 2012)。目前遗传信息社会学领域的专家有北卡罗来纳大学教堂山分校的华人人口学家与社会学家国光教授及其团队,斯坦福大学的Benjamin Domingue,普林斯顿大学的Dalton Conley, 南加大的Daniel Benjamin,和牛津大学的Melinda Mills及其团队等。遗传学的研究成果目前主要以三种形式被运用在社会学方法中:
(1) 遗传信息作为控制变量
由于传统社会学模型一般不将遗传因素分离出来,研究报告的社会环境影响的效果往往被高估。在模型中将遗传信息作为控制变量可以剔除基因对人类行为的影响,研究纯粹的社会环境对个体行为特征的影响。例如,因为父亲和孩子共享50%的遗传物质,而根据先前提到的GWAS,教育程度是可遗传的,所以父亲的受教育水平对子女的受教育水平的影响不仅仅是环境影响。只有测量与父亲教育程度相关的基因后,研究者才可以准确地估计出父亲教育水平对子女教育获得的影响(胡文 etal 2012)。将基因信息作为社会研究中的控制变量可以有效提高研究功效。因为控制了原本属于误差的变量,遗传信息社会学家可以降低社会环境影响的标准误差(Benjamin et al 2011)。
(2) 遗传信息作为工具变量 (instrumental variable)
基因也可以作为工具变量被运用在估计可观测数据中非遗传因素模型因果关系。比如本次推送作者的一项研究课题就是探讨受教育程度与后期健康状况的因果关系。大量西方研究表明,受教育程度与老年时期健康状况呈正相关性。但鲜有研究真正探索其中的因果关系。受教育程度是内生的(endogenous),比如教育程度与个人能力是正相关的,而个人能力是无法观测的遗漏变量。这就导致教育程度与误差项相关了,违反了普通最小二乘法(OLS)的基本假设。用OLS得到的影响是不准确的。
遗传信息作为工具变量,由于其在个体出生前就已经随机分配决定不可改变,其与混杂因素(如出生后的环境、社会经济地位、行为因素)被认为无关联。教育程度GWAS的研究成果提供了74个与受教育年数相关的遗传变异。在剔除那些可能同时与健康相关的遗传信息后,用剩下的34个SNPs建立多基因遗传风险评分(Polygenic risk score)作为工具变量。作者的研究发现教育程度与健康状况有显著的因果关系。教育程度对老年健康具有保护作用。这种将基因变异作为工具变量的方法被称为孟德尔随机化(Mendelian Randomization, MR)。 近年来MR法成为流行病学研究的热点,比如Norton and Han (2008), Ding et al. (2009), von Hinke KesslerScholder et al (2010)等。
(3)基因和环境的交互作用
遗传信息社会学可以通过对基因和环境的相互作用进行分析来理解社会环境怎样影响遗传的作用。基因和环境的之间的相互作用研究是根据某种环境抑制/催化某种基因的表达的原则进行分析的。举一个社会科学的例子:Domingue et al (2017)研究了丧偶的中老年人的基因类型对抑郁症的影响。那些近期有过丧偶经历的中老年人很有可能出现抑郁症状。但是,并不是所有人都以相同方式面对丧偶的经历。研究发现,携带较高的幸福感多基因遗传风险评分(Polygenicrisk score on wellbeing)的中老年人不太容易受到丧偶经历的影响而导致抑郁症状。幸福感的多基因遗传对丧偶带来的负面影响具有缓冲作用。
结语
越来越多的研究发现许多人格特征,行为是可遗传的。但是在理解遗传因素作用时,绝对不能把遗传因素简单化作为影响人类行为特征的主要原因。媒体报道经常以“教育程度基因”“生育基因”“离婚基因”“暴力基因”这样的题目吸引眼球。这使得人们误以为人类特征和基因之间存在一对一的必然关联,这是极度错误的。本文中所提到的与教育,生育,幸福感相关的基因,都只能解释1%-3%的个体差异,效应量非常之小。环境因素依旧是人类特征、行为的主导因素。一方面,社会科学需要正视遗传因素与人类行为特征之间的关系,利用分子遗传学的研究结果来辨析个体内在的固有差异。另一方面,社会学也需要警惕“遗传决定论”的不利影响,不夸大遗传作用,客观展示社会环境影响遗传因素的过程和机制,以此来使公众对环境和遗传的影响有正确的认识。
参考文献:
Benjamin,D. J., Cesarini, D., Chabris, C. F., Glaeser, E. L., Laibson, D. I., Age, G.,... & Smith, A. V. (2011). The promises and pitfalls of genoeconomics.
CARDIoGRAMplusC4D Consortium. (2015). A comprehensive 1000 Genomes-based genome-wide associationmeta-analysis of coronary artery disease. Nature genetics.
Ding,W., Lehrer, S. F., Rosenquist, J. N., & Audrain-McGovern, J. (2009). The impact of poor health on academic performance: New evidence using genetic markers. Journal of health economics, 28(3),578-597.
Domingue,B. W., Liu, H., Okbay, A., & Belsky, D. W. (2017). Genetic heterogeneity in depressive symptoms following the death of a spouse: Polygenic score analysis of the US Health and Retirement Study. American Journal of Psychiatry, appi-ajp.
Frayling,T. M. (2007). Genome–wide association studies provide new insights into type 2 diabetes aetiology. Nature Reviews Genetics, 8(9),657-662.
胡雯, 张浩, 李毅, 刘世定, & 国光. (2012). 分子遗传学的发展对社会学的影响. 社会学研究, 5,011.
Lambert,J. C., Ibrahim-Verbaas, C. A., Harold, D., Naj, A. C., Sims, R., Bellenguez,C., ... & Grenier-Boley, B. (2013). Meta-analysis of 74,046 individuals identifies 11 new susceptibility loci for Alzheimer's disease. Nature genetics, 45(12), 1452-1458.
Loos,R. J., & Yeo, G. S. (2014). The bigger picture of FTO [mdash] the first GWAS-identified obesity gene. Nature Reviews Endocrinology, 10(1),51-61.
Norton,E. C., & Han, E. (2008). Genetic information, obesity, and labor market outcomes. Health Economics, 17(9), 1089-1104.
von Hinke Kessler Scholder, S., Smith, G. D., Lawlor, D. A., Propper, C., & Windmeijer, F. (2010). Genetic markers as instrumental variables: An application to child fat mass and academic achievement (No.CWP03/10). cemmap working paper.