Neuron最新综述：信息搜寻的神经机制

人工智能学家 · 公众号 · · 2024-05-25 17:01

正文

导语

日常生活工作中，我们不断搜寻信息以做出更好的决策。尤其是在当今社会，当更多信息触手可及时，我们选择收集的信息决定了决策的质量。决策神经科学长期采用实验方法，实验中决策者可以使用的信息完全由研究者控制，导致对信息搜寻的神经机制理解较少。

虽然信息搜寻在探索-利用权衡的背景下已经研究很久，但近期的研究扩大了范围，以一种与其他决策过程截然不同的方式研究信息搜寻的机制。这些研究在过去几年中积累的证据和结论提出了一种可能性：信息搜寻是由奖励系统所传递的信息的主观价值所驱动的。这篇文章回顾了最近研究的发现，强调了不同文献之间的概念和实验联系，并讨论了未来研究方向，更全面地理解个体在基于价值的决策中搜寻信息的方式和机制。

研究领域： 信息搜寻，决策，好奇心，奖励系统，探索-利用权衡

来源：集智俱乐部

作者：尹爱华

论文题目：Neural mechanisms of information seeking

论文期刊：Neuron

论文地址：

https://www.cell.com/neuron/abstract/S0896-6273(24)00246-0

想象你是一个咖啡爱好者，你会如何选择咖啡店？如果你现在在居住的城市，你可能已经有了一个多年光顾的咖啡店，因此可能不需要APP的在线评论。然而，你仍然可能以不同的方式去搜寻信息：可能会不时地访问其他店铺，看看这些店铺的咖啡质量是否有所提高；当城市中开设新的咖啡店时，可能会尝试一下，看看这些新店的咖啡是否比当前的最爱更好。如果你出差去了一个新的城市，过去的经验可能不再有用，你需要重新累计对不同咖啡店的体验，你会更加积极地去探索，在不同咖啡店消费，直到找到新的最爱，并开始定期消费；作为一个咖啡爱好者，你可能会对咖啡文化保持好奇，你会阅读世界各地咖啡店的博客和社交媒体帖子。上面这个例子时我们无数日常生活决策的缩影，可以看出信息搜寻具有多样性。人们搜寻信息以解决具体决策问题或出于好奇心。

图1 跨决策上下文的信息搜寻

单个信息搜寻的神经机制

图2 概率性奖励结果的单次先验信息

为了阐明信息搜寻的神经认知机制，一些研究聚焦于与未来结果相关的单个信息的神经活动。这些研究的实验范式中，参与者面对的是非确定性的与概率有关的奖励结果，例如金钱或果汁。参与者首先被呈现关于随机结果的线索（例如，果汁奖励的可能数量及其概率），然后选择是否一定风险获取新的信息。尽管现实世界中的某些决策问题涉及多个先验信息，但聚焦于单个信息有助于通过实验描述潜在的神经过程。

图3 好奇心研究的实验范式

另一类文献关注好奇心的神经基础。尽管好奇心直观上会驱动信息搜寻行为，但相关研究更多集中于好奇心的心理感受，通常是通过诸如小测验或魔术之类的刺激产生的。研究显示，尽管这一领域的研究还处于初期阶段，但一些研究一致地证明了 多巴胺奖励系统参与信息搜寻行为。

时间段内的信息搜寻机制

决策者经常需要在一段时间内收集多条信息来做出决策。目前少尝试通过实验探究单次信息搜寻的神经认知机制如何泛化到时间段内的信息搜寻，现有的研究主要集中在两类决策问题上：强化学习中的探索-利用权衡和证据积累的停止。

图4 探索-利用权衡研究

强化学习主体通常基于过去的行动和奖励的关联性来选择奖励最大化的行动，但这种方法在动态环境中可能导致次优行为。多臂老虎机任务经常被用来研究这种权衡。

Neuron最新综述：信息搜寻的神经机制

正文

单个信息搜寻的神经机制

时间段内的信息搜寻机制

请到「今天看啥」查看全文