耶鲁、剑桥等开发MindLLM，将脑成像直接转换为文本

ScienceAI · 公众号 · · 2025-03-04 11:50

正文

将 ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯

编辑 | 萝卜皮

将功能性磁共振成像 (fMRI) 信号解码为文本一直是神经科学界面临的一项重大挑战，它有望推动脑机接口的发展，并加深对大脑机制的了解。然而，现有的方法往往存在预测性能不佳、任务种类有限以及跨受试者泛化能力较差等问题。

针对这一问题，耶鲁大学（Yale University）、达特茅斯学院（Dartmouth College）和剑桥大学（University of Cambridge）的研究人员提出了 MindLLM，一种专为主题无关且用途广泛的 fMRI 到文本解码而设计的模型。

此外，研究人员提出了一种新方法——大脑指令调整 (BIT)，可增强模型从 fMRI 信号中捕获不同语义表示的能力，从而促进更通用的解码。

在全面的 fMRI 到文本基准上的评估中， MindLLM 优于基线，下游任务提高了 12.0%，未知主题泛化提高了 16.4%，新任务适应提高了 25.0%。此外，MindLLM 中的注意力模式为其决策过程提供了可解释的见解。

该研究以「 MindLLM: A Subject-Agnostic and Versatile Model for fMRI-to-Text Decoding 」为题，于 2025 年 2 月 18 日发布在 arXiv 预印平台。

解码人类大脑活动（fMRI）为文本在神经科学领域引起了广泛关注。这一技术不仅为认知、行为和意识研究提供了新视角，还具有重要的社会应用价值。

例如，它可以帮助语言障碍者恢复沟通能力，使他们能够轻松表达思想；同时，它还能实现健康人群对数字设备（如具身 AI 或假肢）的神经控制，使操作更加直观和精确。

然而，该技术仍面临重大挑战：一是需要针对不同应用场景开发多功能解码模型，现有方法如 UMBRAE 虽能映射 fMRI 数据到刺激图像，但无法处理更广泛的任务（如记忆检索）；二是缺乏统一且不依赖个体的解码架构，当前方法依赖预处理选择响应体素，导致输入维度不一致和空间信息丢失，影响性能。

研究人员提出了 MindLLM，一种用于 fMRI 到文本解码的主题无关且通用的模型。该方法包括一个主题无关的 fMRI 编码器和一个现成的 LLM。

推荐文章

最英国 · 以为少吃就能瘦？BBC震三观纪录片告诉你：人胖分3种，并不都能靠节食减肥！

20 小时前

英国那些事儿 · 美国名嘴遭软禁！心智正常却被诬“痴呆”？！她隔窗偷扔纸条：救我！

2 天前

中核集团 · 专访全国人大代表刘士鹏：解码中国核城的创新发展与未来智变

2 天前

英国那些事儿 · 马斯克乌鸦嘴成真？刚警告“坐飞机不安全”，美国又有飞机坠毁....

3 天前

英国大家谈 · 视频号平台开放广告投放啦！

3 天前

摄像人网 · 怎样把电子稳定器变成车拍神器

7 年前

科尔沁都市报 · 紧急！扩散！请立即按照此方法设置电脑！防止感染比特币勒索病毒！

7 年前

景观周 · 10W+人排队去他家滚床单？！

7 年前

陆家嘴金融 · 煎饼大妈月入3万，烧饼大叔赚7套房！白领其实是最不值钱的工种，正被世界淘汰的你却不知！

7 年前

视觉志 · 七言｜想做一个很酷的人……

7 年前