翻看任何报纸、杂志或是网站一周之内更新的内容,你都不难发现一些关于饮食的研究报道。可能本周你会看到脂肪对你有好处,咖啡则对健康有害的观点。或者,脂肪对人体有害,但咖啡有利于健康。如果你是这类文章的长期读者,或是抱持“基于证据做出选择”观点的人,你一定不会忽略一种现象:这类不断更新的文章常常自相矛盾。你很难相信所有的研究都是同时正确的。
对于一个大部分时间都在做研究的人来说,媒体很容易被误认为是没有参考广泛背景而截取了片面的结果。当然,我们的确经常看到一些以标题吸引目光的做法,比如“西红柿会引起心脏病发作吗?”,尽管答案是“否”。但在我看来这都不是主要的问题,至少这不是唯一的问题。相反,最主要的问题是,报道所引用的研究本身就带有显著的偏见。
饮食研究就是一个最好的例子。大多数对饮食的研究都是类似的:研究人员征集一组人进行采访,询问他们的饮食习惯,筛选出符合其理想模型的人选,然后将他们所报告的饮食选择与体重或心血管健康等结果联系起来。但这些研究有一个明显的问题,即人们并不是随意选择食物的。当你查看整体数据中一种特定食物,并试图了解它的影响时,不可能只考虑单一种类食物对人体的影响,因为诸多因素都会影响人们选择吃何种食物。
在许多情况下,我们很难判断一种食物究竟对身体有利,还是有害。以咖啡为例,一方面,有喝咖啡习惯的人平均受教育程度更高,也更经常主动锻炼。另一方面,他们倾向于吸更多的烟。因此可能是这些差异共同导致了人们健康的差异,而不仅仅是咖啡。研究人员通常应该控制这些变量,让结果更科学,但调整不同的因素常常导致不同的结果,于是乎咖啡有时看起来是好的,有时候却很糟。
目前已经发表的研究通常都承认这个问题是存在的,有时候媒体报道也会提到这一点,它在学术上有许多不同的名称:不可避免的残余混杂(residual confounding), 忽略变量偏差(omitted variable bias), 选择性偏差(selection bias),“相关但不代表因果关系”(correlation is not causation)。通常情况下,这件事会被草草交代了事,读者大多会看到一行字:“我们的研究具有局限性,部分因素可能尚未被考虑到。”这种做法给我们留下的印象是,这些因素在实际上影响很小。
实际上是如此吗?或者这就是饮食研究里不可避免的?
为了搞清楚这个问题,我打算做一个新尝试:拆解所谓混杂(confounding)带来的误差,以个人整体的饮食方式来判断食物和体重的关系。我决定用一流的采集数据和标准的分析工具来回答一个简单的问题:“哪些食物能让人变瘦?”