专栏名称: 开智学堂
未来的创造者,从这里起步。开智学堂是一个学习社区,在这里你可以与小伙伴一起学习编程和写作等21世纪人才所需的技能。
目录
相关文章推荐
杭州发布  ·  连发7天!杭州新一轮餐饮消费券来了! ·  昨天  
杭州发布  ·  连发7天!杭州新一轮餐饮消费券来了! ·  昨天  
川大研究生  ·  德渥群芳 | 范浩军教授 ... ·  5 天前  
川大研究生  ·  德渥群芳 | 范浩军教授 ... ·  5 天前  
国际家居  ·  榻榻米真OUT了,宜家新出一套神奇家具 ·  6 天前  
国际家居  ·  榻榻米真OUT了,宜家新出一套神奇家具 ·  6 天前  
艾锋降级  ·  新功能!iOS微信8.0.54更新,内置通行 ... ·  1 周前  
51好读  ›  专栏  ›  开智学堂

聪明的学习者都知道的科学概念:双盲实验

开智学堂  · 公众号  · 科技自媒体  · 2017-06-15 20:32

正文

从前,有一个星球。

最初,它荒芜人烟,满是牛鬼蛇神。不知道从哪一天开始,星球上出现一些极具好奇心又不怕死的人。因为好奇,因为想解答心中那些挥之不去的疑问,他们开始冒天下之大不韪——撕破谎言,搞破坏,提出离经叛道的想法,自己试验和批评这些想法……

渐渐地,这群好奇宝宝越来越多,赶跑了一批牛鬼蛇神,把星球建设地强大而富足。这个星球,就是科学星球。

因为科学星球的繁盛,吸引了不少移民。可是很多人都被拒绝了。也有一些人伪装成星球的居民混进去,但是很快就会暴露身份。黑市中开始流传各种消息,出售可以蒙混过关的假证件。

其实,在信息公开透明的科学星球,有厚厚的一本移民指南,但是大家都看不懂。在外来移民的呼吁之下,星球发行了一批入场券,帮助大家准备移居。现在,我们来介绍其中备受欢迎的一张:双盲实验。

什么是双盲实验

A blind — or blinded — experiment is an experiment in which information about the test is masked (kept) from the participant, to reduce or eliminate bias, until after a trial outcome is known. If both tester and subject are blinded, the trial is called a double-blind experiment.   — Blind experiment - Wikipedia

双盲是科学方法的一种,目的是避免研究结果受安慰剂效应或观察者偏向所影响。 —— 维基百科

在科学实验中,设计良好的实验一般会有两个相互比较的组别:

  • 试验组:接受某种待验证的试验(如某种药物治疗)方案

  • 对照组:除了待验证的变量以外,其他变量都与实验组相同

双盲实验中:

  • 被试者不知道自己属于实验组还是对照组

  • 试验者不知道哪一组是试验组,哪一组是对照组

双盲实验为什么重要

双盲实验的设计,目的是尽量规避人的认知偏差。即便在最严谨的科学实验中,研究结果常常会受到诸如安慰剂效应或观察者期望效应的影响。

安慰剂效应(placebo effect),指病人虽然获得无效的治疗,但却「预料」或「相信」治疗有效,而让病患症状得到舒缓的现象。安慰剂效应于 1955 年由 Henry K. Beecher 提出,亦理解为「非特定效应」(non-specific effects)或受试者期望效应(subject-expectancy effect)。

观察者期望效应是认知偏差的一种。在科学实验中,由于观察者预期某些测试结果,于是无意识地以某种形式操纵了实验步骤,或错误解释实验结果以达至他们希望得到的结论。观察者期望效应能严重歪曲实验结果。

如果科学实验一直受认知偏差的影响,无法突破原有的认知边界,实验结果就无法起到拓展知识、变革现状的作用。从这个意义上讲,双盲实验是保证科学实验结果有效性的一套机制,也是激励科学实验自我优化和革新的一种推动剂。

Edge.org 网站每年都会提出一个 Big question,激发知识界的集体思维碰撞。 2011 的年度问题是 :

What Scientific Concept Would Improve Everybody’s Ccgnitive Toolkit?

进化生物学家、科普作家,「自私的基因」一书作者道金斯的回答是:双盲实验。他认为,如果民众缺乏独立思考的训练,容易被个人观点、偏见、奇闻轶事所影响,而不是去寻找确凿的证据。如果掌握双盲实验的原理,即便不去实施真正的双盲实验,也能在以下方面提高个人的独立思考能力和判断:

  • 我们不会期望从奇闻轶事中得出严肃结论

  • 我们将学会评估,一个重要的结论有多大可能性只是产生于偶然

  • 我们会知道消除主观偏见有多么困难,而且它并不意味着不诚实或任何形式的静默。它让人们不再迷信权威和个人

  • 我们将学会看穿顺势疗法和其他江湖郎中的把戏

  • 我们将更全面地学习批判性思维习惯,这不仅将改善我们的认知工具包,而且可能拯救世界

如何用双盲实验改进思维习惯

阳志平老师在 「好思想,坏思想」系列中一再强调,好思想的首要判断标准是证据。最有力的证据来自设计良好的实验,而双盲实验就是最好的实验设计(之一)。

在区分「事实」和「观点」时,只要拿出双盲实验的标准一对照,就能发现绝大部分的「结论」、「研究」其实经不起推敲,很难判断研究者的认知偏差是否影响了研究结果。比如当看到一个数据时

保健品 X 令 45% 的使用者改善了睡眠质量。

我们可以提出「数据五问」:

  • 一问关键概念:使用了哪些关键概念,如「使用者」,「改善」,「睡眠质量」,都是如何定义的?

  • 二问关键指标:如何定义和衡量,如「改善睡眠质量」?

  • 三问效用范围时-空-人三个维度 —— 多长时间范围内有效?是否受地域限制?适用于哪些人群?

  • 四问数据来源:是一手实验所得,还是二手数据,甚至出处不明?

  • 五问实验过程:如何设计的?如何取样的?是否有对照组?是否双盲?结果是否进行了统计检验?是否有类似实验佐证了结果?

补充材料:Simposon’s Paradox

分组和取样是双盲实验中关键的步骤。但是在这些步骤中很容易产生偏差,Simposon’s Paradox 就是其中的一种。

Simpson’s paradox, or the Yule–Simpson effect, is a paradox in probability and statistics, in which a trend appears in different groups of data but disappears or reverses when these groups are combined. It is sometimes given the descriptive title reversal paradox or amalgamation paradox. ——Simpson’s paradox - Wikipedia

当人们尝试探究两种变量是否具有相关性的时候,会分别对之进行分组研究。然而,在分组比较中都占优势的一方,在总评中有时反而是失势的一方。——辛普森悖论 - 维基百科,自由的百科全书

比如公司 A 和公司 B 都生产同一类药物。公司 A 的药物,在两组测试中分别得到 70% 和 40% 的有效性,公司 B 的药物则是 80% 和 50%。乍看之下,公司 B 在两轮中都胜出,但是实际上,公司 A 的有效总人数更多。

为了避免辛普森悖论的出现,就需要斟酌各分组的权重,并乘以一定的系数去消除以分组数据基数差异而造成的影响。

下面两张图片可以更直观地看到分组取样和整体取样对结果的影响:

参考资料

  • Blind experiment - Wikipedia

  • Edge.org-2011 : WHAT SCIENTIFIC CONCEPT WOULD IMPROVE EVERYBODY’S COGNITIVE TOOLKIT?

  • Placebo Effect, Control Groups, and the Double Blind Experiment (3.2) - YouTube

  • 安慰剂效应

  • 观察者期望效应

  • 顺势疗法

  • Simpson’s paradox - Wikipedia

  • Simpson’s Paradox - YouTube

——- 另一张入场券是人工智能 -——

掌握深度学习原理
搭建神经网络模型
熟悉自然语言处理
开发智能个人助理

  戳原文,马上预约下期!