专栏名称: 物种日历
兔狲、龙猫、几维鸟,总有一款毛球打动你;铃兰、桔梗、四照花,植物们也可以萌萌哒~ 跟着日历娘,每天认识一个物种,让你的世界,每天变得更萌一些!
目录
相关文章推荐
Python爱好者社区  ·  DeepSeek创始人梁文锋个人履历 ·  昨天  
Python爱好者社区  ·  多模态,杀疯了 ·  16 小时前  
Python开发者  ·  o3-mini 碾压 DeepSeek ... ·  4 天前  
Python开发者  ·  请立即拿下软考证书(政策风口) ·  2 天前  
Python爱好者社区  ·  120道Python面试题.pdf ... ·  6 天前  
51好读  ›  专栏  ›  物种日历

什么?鸽子也会打乒乓球?

物种日历  · 公众号  ·  · 2024-07-31 11:30

正文

鸽子,是 和平 说话不算数 的象征。不过,有位科学家却想让它们拥有更多技能,比如教它们打乒乓球,甚至让它们在战争中操纵导弹。


肉鸽、信鸽、观赏鸽,它们都由原鸽(Columba livia)驯化而来 | Diego Delso / wikipedia

差点壮烈成仁,咕

二战时期,著名的心理学家斯金纳(Burrhus Frederic Skinner)向美国军方提议, 用鸽子来操纵导弹。


行为主义心理学大师——斯金纳 | Silly rabbit / wikipedia


鸽子开导弹,说来其实也容易:


根据斯金纳的设计,导弹中安置空舱,鸽子被放在空舱里,前面有一个小显示屏,轰炸目标会显示在屏幕上,呈现为一个小点;


经过训练的鸽子,会不停地啄这个小点,它嘴上装着的金属传导器,会根据鸽子啄屏幕传达的信息,不断修正导弹的飞行方向,直达目标,轰!


当然,轰炸成功之后, 鸽子也就壮烈牺牲了


“还想投产是怎地?” | Eatcha / wikimedia


经过训练,鸽子在啄屏幕上表现优秀。 不过“鸽子导弹”从来都没有投产过。 随着无线电操纵技术的进步,这个怪想法就被人们抛在脑后了。


斯金纳失望地说,根本没有人想认真对待这项发明。不过, 他的鸽子仍然名垂心理学史

教鸽子打乒乓球

斯金纳是一位行为主义心理学家。由于技术局限,当时人们还无法研究大脑的活动,所以这个学派关注的是看得见、摸得着的行为。斯金纳对行为主义最大的贡献,就是研究出了一套 操纵动物行为的“驭鸽道”, 不管是鸽子、小白鼠还是人,他都能操纵。


斯金纳的方法说来也简单,不过是 “胡萝卜”与“大棒”兼用 ,来控制动物一步一步学习,完成他给的任务。他把“胡萝卜”称为“正强化”(Positive Reinforcement),免于“大棒”殴打则称为“负强化”(Negative Reinforcement)。这两件东西如何给予,决定了动物会做出怎样的事情。


斯金纳在用斯金纳箱训练老鼠的行为 | U3144362 / wikipedia


他造了一个教动物完成任务的机器:斯金纳箱(Skinner box)。箱子里有一个杠杆,按下杠杆,就会有一粒饲料掉出来。 斯金纳把鸽子放进箱子里,鸽子偶然啄到杠杆,就能吃到饲料,这是一种正强化。 时间一长,鸽子就会主动去啄杠杆。


训练鸽子的斯金纳箱 | Mark E. Bouton from University of Vermont / Wikipedia


斯金纳箱本身很简单,但运用这个原理,可以训练动物完成相当复杂的任务。斯金纳最有名的“绝技” 是教鸽子打乒乓球。 他的训练方法是这样的:


给鸽子一个固定住的乒乓球,如果它啄球,就给它食物奖励。鸽子养成习惯后,把球换成活动的,在一个小平台(鸽子的“球桌”)上安置机械;如果鸽子啄球,球往上滚一段,触发开关,就会有食物掉出来,这样鸽子就学会了把球往上推。斯金纳一点点把机械拿远,让鸽子一点点把球推出更长的距离,最后鸽子只有把球推到桌子另一头,才能得到奖励。


最后,把两只学会了推球的鸽子放到同一个平台的两边,再给它们乒乓球,无论球滚向哪一方,鸽子都会把球推回去,你来我往,打得相当热闹。


鸽子打乒乓球 | Bfskinnerfoundation / youtube


为了心中的奖励,两只鸽子都全神贯注盯着球,时刻准备调整位置,有时要打上五六个来回,才有一方把球推出桌子“得分”。


打乒乓球打赢的一方会从机器里得到奖励 | Bfskinnerfoundation / youtube

从教学机器到“玩物丧志”

斯金纳显然不满足教鸽子“打乒乓球”,他想把这种训练方法运用到更有价值的地方去。斯金纳设计了给学生用的教学机器,甚至还写了一部小说《第二个瓦尔登》(Walden Two)宣传他的教育理念, 运用正强化和负强化,把孩子随意“捏圆搓扁”,塑造成对社会有用的人。


斯金纳的著作《第二个瓦尔登湖》 | B. F. Skinner / Macmillan / wikipedia


考满分奖励好吃的是“正强化”,考满分不会被笤帚伺候就是“负强化”。


斯金纳的想法不免存在 局限性 ,但他的影响还是十分深远。不仅是教学, 其他领域也在运用斯金纳的原理, 设计“人类的斯金纳箱”。通过循序渐进地设立任务,安排适当的正强化(奖励)和负强化(免于惩罚)来引导人们的行为,在我们熟悉的东西里, 最符合这个理念的莫过于游戏了。


在训练动物时,斯金纳发现了一个有趣的现象,动物并不是奖励越多就干活越多。如果斯金纳箱设计成鸽子一啄杠杆,就给食物,鸽子很快就会厌倦; 如果啄很多次才偶然给予食物,鸽子反而乐此不疲,啄个不停,绝不“放鸽子”。


同理,游戏设计会故意提高一些东西的稀有度,让我们不惜熬夜爆肝,氪金抽卡的稀有装备、SSR卡、闪光精灵等,不外如是。


哇~!金色……普通 | Zaid Sparrow / wikimedia







请到「今天看啥」查看全文


推荐文章
Python爱好者社区  ·  DeepSeek创始人梁文锋个人履历
昨天
Python爱好者社区  ·  多模态,杀疯了
16 小时前
Python开发者  ·  请立即拿下软考证书(政策风口)
2 天前
Python爱好者社区  ·  120道Python面试题.pdf ,完全版开放下载
6 天前
北京吃货小分队  ·  只有6张桌却成了北京苍蝇馆子传奇
8 年前
数据派THU  ·  【独家】一文读懂聚类算法
7 年前
中泰证券研究所  ·  中泰研究|一周精彩回顾
7 年前