专栏名称: nextquestion

科研就是不断探索问题的边界

追问daily | 9.11大于9.9？麻醉药如何让你昏迷？人工智能精准预测阿尔茨海默病进展

nextquestion · 公众号 · · 2024-07-16 17:42

正文

请到「今天看啥」查看全文

█ 脑科学动态

麻醉药通过干扰大脑动态稳定性让你失去意识

大脑如何协同工作以产生创造性思维？

SH2B1基因通过神经回路调控食欲，抑制肥胖

原子力显微镜在神经系统疾病诊断中的应用潜力

抑郁症的独特神经特征揭示新治疗可能

新的神经生物标志物助力强迫症脑深部刺激治疗

█ AI行业动态

9.11大于9.9？大模型集体翻车

OpenAI新项目「草莓」更新

谷歌新技术：机器人通过深度学习模型提升导航与互动能力

《情绪与焦虑障碍患者指南》发布

█ AI研发动态

新型神经网络RTNet展示人类感知决策特征

人工智能工具超越临床测试，精准预测阿尔茨海默病进展

AI在心理治疗中的角色及其与人类共情的平衡

机器学习助力脑震荡早期诊断

机器学习算法助力准确步长测量

突破语言模型适应的局限：分支合并法有效缓解灾难性遗忘

光纤神经网络：未来机器学习的可持续新途径

提升人工智能模型信任度：MIT新技术更精准预测不确定性

人工智能聊天机器人存在“同理心缺失”，儿童用户面临潜在风险

脑科学动态

麻醉药通过干扰大脑动态稳定性让你失去意识

麻省理工学院的神经科学家团队通过研究揭示了麻醉药物丙泊酚如何使大脑失去意识。这项研究由皮考尔学习与记忆研究所的Earl K. Miller教授和K. Lisa Yang综合计算神经科学中心的Ila Fiete教授领导。

研究团队使用了一种名为DeLASE（delayed linear analysis for stability estimation，延迟线性分析稳定性估计）的方法，来量化复杂系统中群体级动态稳定性的变化。通过使用丙泊酚将动物从清醒状态过渡到麻醉失去意识状态，并应用DeLASE技术分析猕猴皮层局部场电位（LFPs），他们发现，在麻醉状态下，神经动态比清醒状态更不稳定。

具体而言，研究人员记录了动物大脑在接受丙泊酚后的电活动，分析了大脑在失去意识前后的动态稳定性。为了克服记录范围有限的问题，研究团队采用了延迟嵌入（delay embedding）技术，以更全面地描述神经系统的动态变化。研究结果显示，丙泊酚通过干扰大脑的动态稳定性导致失去意识。在丙泊酚作用下，大脑在输入刺激后恢复到基线状态的时间变得越来越长，直到大脑进入过度兴奋的状态并最终失去意识。

进一步的计算模型实验也证实了这一发现，表明增加抑制会导致网络活动的不稳定，进而引起意识丧失。这些结果支持了麻醉药物通过干扰动态稳定性引起意识丧失的假设。研究团队还计划将这一技术应用于其他大脑状态的研究，包括神经精神疾病如抑郁症和精神分裂症的研究。这项研究发表在 Neuron上。

#神经科学 #Neuron #麻醉 #丙泊酚 #大脑动态稳定性

阅读论文：

Eisen, Adam J., et al. “Propofol Anesthesia Destabilizes Neural Dynamics across Cortex.” Neuron, vol. 0, no. 0, July 2024. www.cell.com, https://doi.org/10.1016/j.neuron.2024.06.011.

大脑如何协同工作以产生创造性思维？

创造性思维是人类独有的特征，其神经学来源一直难以捉摸。由犹他大学健康科学和贝勒医学院研究人员组成的团队，通过精准的脑成像方法，揭示了大脑不同部分如何协同工作以产生创造性思维。

研究团队怀疑创造性思维可能依赖于默认模式网络（DMN），这一网络在冥想、白日梦等内向型思维活动中被激活。DMN分布于大脑多个区域，实时追踪其活动较为困难。研究人员采用立体脑电图，通过在13名癫痫监测患者的大脑中植入微型电极，精确追踪多个脑区的电活动，涵盖多个典型的DMN区域。

结果显示，在进行创造性思维任务时，如列举日常物品的新用途，DMN首先活跃，随后与涉及复杂问题解决和决策的脑区同步。这表明创造性想法起源于DMN，并由其他脑区评估。当研究人员用电极暂时抑制DMN的特定区域活动时，参与者的创造性思维能力下降，但其他脑功能如心智漫游保持正常。这表明创造性思维不仅与DMN相关，而且依赖于DMN的正常活动。

进一步的研究表明，DMN活动在自发性思维和发散性思维中的表现不同，且在一些疾病如抑郁症中发生改变。通过深入了解DMN的正常运作，研究团队希望找到改善这些疾病的新方法，并激发创造性思维的干预措施。研究发表在Brain上。

#认知科学 #Brain #创造性思维 #默认模式网络 #脑成像

阅读论文：

Bartoli, Eleonora, et al. “Default Mode Network Electrophysiological Dynamics and Causal Role in Creative Thinking.” Brain: A Journal of Neurology, June 2024, p. awae199. PubMed, https://doi.org/10.1093/brain/awae199.

SH2B1基因通过神经回路调控食欲，抑制肥胖

肥胖是一种复杂的疾病，由遗传、饮食环境和行为等多种因素共同作用。密歇根大学的梁友瑞博士及其团队通过研究SH2B1基因，发现其在调节食物摄入和能量消耗方面起重要作用。该研究团队通过定位SH2B1基因在大脑中的作用区域，进一步揭示其在肥胖和代谢疾病中的作用机制。

研究表明，SH2B1基因突变与肥胖、2型糖尿病和代谢功能障碍性脂肪肝病（MASLD）有关。在小鼠实验中，删除Sh2b1基因会导致严重的肥胖和代谢疾病。研究团队发现，表达SH2B1的神经元形成了一个回路，与大脑干的背缝核（DRN）神经元相连接。通过光遗传学刺激PVHSH2B1轴突纤维在DRN的活动，可以抑制食物摄入。长期抑制PVH中的SH2B1神经元会导致肥胖。SH2B1通过增强脑源性神经营养因子（BDNF）/TrkB信号传导来帮助维持体重。当这种信号传导异常时，会导致肥胖和代谢疾病。此外，增强SH2B1蛋白尚未发现副作用，这为治疗肥胖及相关疾病提供了巨大潜力。研究发表在Advanced Science上。

#大脑健康 #肥胖 #SH2B1 #光遗传学 #脑源性神经营养因子

阅读论文：

Li, Yuan, et al. SH2B1 Defends Against Energy Imbalance, Obesity, and Metabolic Disease via a Paraventricular Hypothalamus→Dorsal Raphe Nucleus Neurocircuit. onlinelibrary.wiley.com, https://doi.org/10.1002/advs.202400437. Accessed 16 July 2024.

原子力显微镜在神经系统疾病诊断中的应用潜力

近年来，神经系统疾病对社会造成了日益严重的负担，迫切需要改进诊断和治疗方法。由新加坡国立大学的Chwee Teck Lim教授领导的研究团队，对原子力显微镜（Atomic Force Microscopy，AFM）在神经生物学研究中的重要作用及其在诊断神经系统疾病和中枢神经系统（CNS）肿瘤中的新兴临床应用进行了综述。

该综述详细探讨了AFM在非临床和临床环境中的应用。在非临床环境中，AFM用于表征实验模型中的神经系统疾病，如研究离子通道分布、基因疾病中的神经元兴奋性及轴突对机械损伤的抵抗力。在临床背景下，AFM展示了其在早期检测和监测阿尔茨海默病、帕金森病和肌萎缩侧索硬化症等神经退行性疾病中的潜力，具体方法包括通过分析脑脊液和血液中的生物标志物。

此外，AFM还被用来评估中枢神经系统肿瘤的刚度（stiffness），这比传统的组织病理学方法提供了更详细的分析，从而提高了肿瘤分级和治疗的效果。尽管AFM在临床应用中前景广阔，但其整合面临着样本异质性和数据分析复杂性等挑战。该研究发表在Med-X期刊上。

#神经技术 #原子力显微镜 #神经系统疾病 #生物力学分析

阅读论文：

She, David T., et al. “Atomic Force Microscopy in the Characterization and Clinical Evaluation of Neurological Disorders: Current and Emerging Technologies.” Med-X, vol. 2, no. 1, June 2024, p. 8. Springer Link, https://doi.org/10.1007/s44258-024-00022-6.

抑郁症的独特神经特征揭示治疗新可能

贝勒医学院的Sameer Sheth教授等多校联合团队发表了一项研究，揭示了抑郁症患者大脑中前扣带回（ACC）的β频率神经活动变化。研究团队在对15名药物难治性癫痫患者进行大脑四个区域的神经活动记录时，患者们执行了一项名为概率奖励任务（PRT）的感知辨别任务。结果显示，多数患者在任务中会根据奖励反馈调整选择，而这一过程与前扣带回（ACC）的β频率振荡密切相关。

研究发现，ACC的β频率神经活动与奖励偏向行为有强正相关，并密切跟踪奖励的获取和价值。这表明，ACC在评估奖励刺激和结果中发挥关键作用，可能作为奖励评估的关键节点。然而，在重度治疗抵抗性抑郁症患者中，奖励处理和β频率活动显著减弱，表现出缺乏奖励导向的行为倾向。

Sameer Sheth教授指出，这一研究发现ACC的β频率活动可以作为快感缺失的潜在生物标志物，这对改善抑郁症和其他相关精神疾病患者的诊断和症状监测有重大潜力。此外，研究团队计划在未来的临床试验中测试通过调节ACC的β频率活动来治疗快感缺失的有效性。研究发表在Nature Communications 上。

#大脑健康 #Nature Communications #快感缺失 #前扣带回 #β频率神经活动

阅读论文：

Xiao, Jiayang, et al. “Beta Activity in Human Anterior Cingulate Cortex Mediates Reward Biases.” Nature Communications, vol. 15, no. 1, July 2024, p. 5528. www.nature.com, https://doi.org/10.1038/s41467-024-49600-7.

新的神经生物标志物助力强迫症脑深部刺激治疗

贝勒医学院和德克萨斯儿童医院的研究团队发现了一种特定的神经活动模式，能够准确预测和监测接受脑深部刺激（DBS）治疗的强迫症（OCD）患者的临床状态。该研究由Sameer Sheth和Wayne Goodman领衔。

研究团队利用现代DBS设备的持续监测功能，记录了12名顽固性强迫症患者的脑部活动模式。在研究的初期，团队在5名患者中记录了腹侧纹状体区域的神经活动，并建立了神经行为模型。随后，这些模型在另外7名患者中得到了验证。研究发现，在DBS激活前，患者的9赫兹功率表现出显著的昼夜节律和高度的可预测性。在DBS激活后，症状改善的患者神经数据的可预测性显著降低，表明这些患者的强迫行为减少。

研究表明，响应良好的患者在DBS激活后，其神经活动模式的可预测性显著下降，这表明患者的行为反应更加多样化，强迫行为减少。这一发现为指导DBS治疗提供了重要的神经生物标志物，有望应用于临床实践，帮助医生更好地调整治疗参数并远程监测患者的症状变化。研究发表在Nature Medicine上。

#大脑健康 #Nature Medicine #强迫症 #脑深部刺激 #神经生物标志物

阅读论文：

Provenza, Nicole R., et al. “Disruption of Neural Periodicity Predicts Clinical Response after Deep Brain Stimulation for Obsessive-Compulsive Disorder.” Nature Medicine, July 2024, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41591-024-03125-0.

AI 行业动态

9.11大于9.9？大模型集体翻车

近日，推特网友Riley Goodside发现，面对“9.11和9.9哪个大”这个问题，GPT-4o、谷歌Gemini Advanced、Claude 3.5 Sonnet等模型均认为9.11更大。此外，有网友发现，当调换提问顺序，把选项放在提问前面时；或者向AI解释这是一个双精度浮点数时，大模型才能正确回答这个问题。

#大语言模型 #幻觉

OpenAI新项目“Strawberry”更新

据路透社独家报道，OpenAI 最新内部项目“Strawberry”（草莓），代号继承自前身 Q*，旨在突破现有技术限制，实现前所未有的高级推理能力。这一项目细节此前鲜为人知，但已被预测将极大推进 AI 技术的发展边界。

据悉，“草莓”项目在公司内部高度保密，其目标是使 AI 模型不仅能响应查询，还能进行长远规划和深入研究，从而在互联网上自主、可靠地导航。这种新能力使得 AI 能在复杂问题解决方面自我引导，提供比现有模型更高级的解决方案。

OpenAI 高管在一次全员会议中展示了相关研究成果，声称新技术具备类似人类的推理能力。这种能力的提升被视为 AI 发展的关键，尤其是在执行长期任务和处理复杂数据集方面。

此外，另一位线人报告，OpenAI已经在内部测试了新模型，在MATH数据集上得分超过90%。路透社无法确定这是否与“草莓”是同一个项目。

#OpenAI #草莓项目 #人工智能 #高级推理 #技术创新

阅读更多：

https://www.reuters.com/technology/artificial-intelligence/openai-working-new-reasoning-technology-under-code-name-strawberry-2024-07-12/

谷歌新技术：机器人通过深度学习模型提升导航与互动能力

谷歌的 DeepMind 团队近日将Gemini 1.5 Pro成功应用于机器人导航和人机交互领域。通过该模型，机器人不仅能记住复杂的环境细节，还能根据语言和视觉指令导航至具体地点。研究团队还介绍了一种名为 Mobility VLA 的导航策略，该策略结合了长上下文视觉语言模型（VLM）和拓扑图，显著提高了机器人在复杂环境中的导航能力。在真实世界的测试中，这种方法在多模态指示导航（MIN）任务中表现出色，能有效理解并响应复杂的用户指令。此外，DeepMind 的研究还探讨了示范游览视频的利用，通过这些视频，机器人可以学习并记忆环境，从而在未来的导航中更为精准。

#DeepMind #Gemini1.5Pro #机器人导航 #人机互动 #AI技术

阅读更多：

https://arxiv.org/pdf/2407.07775v1

AI 研发动态

新型神经网络RTNet展示人类感知决策特征

乔治亚理工学院的研究团队在Dobromir Rahnev教授的带领下，致力于将人类决策科学应用于机器学习领域，以期开发出更为可靠的神经网络模型。该团队发表在 Nature Human Behaviour 上的最新研究，展示了如何使神经网络RTNet在决策过程中表现出人类特征。

研究团队将RTNet神经网络训练在著名的MNIST数据集上，通过加入噪声测试模型的准确性。实验结果显示，RTNet在高速度场景中不仅表现出色，还再现了人类决策中的速度-准确性权衡现象。为了验证RTNet的预测能力，研究人员招募了60名乔治亚理工学院的学生，让他们在数字辨别任务中提供准确性、反应时间和信心数据。对比分析发现，RTNet的表现与人类高度相似，尤其是在准确性、反应时间和信心模式方面。

RTNet基于贝叶斯神经网络（BNN），通过概率来进行决策，并采用证据积累过程跟踪每个选择的证据。BNN每次生成的响应略有不同，随着证据的积累，有时会偏向某个选择，一旦证据足够多，RTNet便会停止积累过程并做出决策。此外，研究还发现，RTNet在未特定训练下自动表现出对正确决策的信心。

这项研究不仅为计算机科学提供了大量人类行为数据，还展示了RTNet在人类决策模型中的巨大潜力。研究团队希望进一步测试RTNet在更广泛数据集上的表现，并将其应用于其他神经网络，以实现更加人性化的决策过程。

#神经技术 #感知决策 #RTNet #贝叶斯神经网络 #速度-准确性权衡

阅读论文：

Rafiei, Farshad, et al. “The Neural Network RTNet Exhibits the Signatures of Human Perceptual Decision-Making.” Nature Human Behaviour, July 2024, pp. 1–19. www.nature.com, https://doi.org/10.1038/s41562-024-01914-8.

人工智能工具超越临床测试，精准预测阿尔茨海默病进展

剑桥大学的科学家们开发了一种机器学习模型，能够在3/4的情况下准确预测早期痴呆症患者是否会发展为阿尔茨海默病。研究人员使用了来自美国研究队列的400多名个体的常规收集的非侵入性低成本患者数据，包括认知测试和显示灰质萎缩的结构性MRI扫描，来构建他们的模型。然后，他们使用来自美国、英国和新加坡的真实患者数据测试了该模型。PPM在预测早期疾病阶段（轻度认知障碍）的患者是否会进展为阿尔茨海默病方面表现出色，准确率为81.66%，AUC为0.84，灵敏度为82.38%，特异性为80.94%。

算法能够区分在三年内进展为阿尔茨海默病和保持稳定的轻度认知障碍患者。该算法能够在82%的病例中正确识别将发展为阿尔茨海默病的个体，并在81%的病例中正确识别不会发展为阿尔茨海默病的个体。这表明该模型可以显著减少误诊。此外，该模型还能够将阿尔茨海默病患者分为三组：症状保持稳定的（约50%的参与者），缓慢进展的（约35%）和快速进展的（剩余的15%）。这些预测在六年的随访数据中得到了验证，有助于在早期阶段识别可能受益于新治疗的人，同时也能识别需要密切监控的人。研究发表在eClinicalMedicine上。

#大脑健康 #人工智能 #阿尔茨海默病 #预测模型 #临床诊断

阅读论文：

Lee, Liz Yuanxi, et al. “Robust and Interpretable AI-Guided Marker for Early Dementia Prediction in Real-World Clinical Settings.” eClinicalMedicine, vol. 0, no. 0, July 2024. www.thelancet.com, https://doi.org/10.1016/j.eclinm.2024.102725.

AI在心理治疗中的角色及其与人类共情的平衡

希伯来大学心理学系的研究团队在Anat Perry教授的领导下，探讨了AI在心理治疗中的应用及其与人类共情的差异。在这项研究中，研究团队定义了共情的不同方面，并比较了人类和AI在这些方面的能力。

研究发现，虽然AI能够模拟共情互动，有时甚至能超越人类的表现，但它缺乏情感层面的真实连接和关怀。研究提出了一种混合治疗模式，即AI在初步患者接待和例行评估等任务中发挥作用，而在人类治疗师需要提供深层共情和同理心的情况下，仍需依赖人类。该研究强调了在心理治疗中保持人类情感联系的重要性，并呼吁行业专业人士和学术研究者在开发和应用AI时，考虑这些见解。研究发表在 JMIR Mental Health 上。

#共情 #人工智能 #心理治疗 #混合治疗模式

阅读更多：

Rubin, Matan, et al. “Considering the Role of Human Empathy in AI-Driven Therapy.” JMIR Mental Health, vol. 11, no. 1, June 2024, p. e56529. mental.jmir.org, https://doi.org/10.2196/56529.

机器学习助力脑震荡早期诊断

轻微脑震荡常常未能得到及时诊断，导致长期严重健康问题。南加州大学维特比工程学院和莱昂纳德·戴维斯老年学院的研究团队，利用机器学习模型来预测脑震荡状态。

研究团队采用贝叶斯机器学习分类器，通过磁共振成像（MRI）中的皮质连接组映射来识别轻微脑震荡患者。分类器特征来自连接矩阵，这些矩阵指定了连接脑结构的白质连接的平均分数各向异性。在一个包含92名健康对照（HC）和471名轻微脑震荡患者的发现样本上测试分类器，并在一个包含256名健康对照和126名脑震荡患者的独立验证样本中复制结果。分类器在两个样本中的准确率均超过99%，显示出对新样本的强大普适性。

研究发现，13对双侧皮质连接对能够以超过99%的准确率预测诊断状态。这些连接主要位于前额叶皮层结构、前额叶-边缘系统和腹侧视觉通路中的枕颞结构。这些连接在认知控制、记忆和注意力中起重要作用，解释了脑震荡后认知障碍的高频率。研究发表在 Journal of Neurotrauma 上。

#大脑健康 #神经技术 #机器学习 #脑震荡 #MRI

阅读论文：

Hacker, Benjamin J., et al. “Identification and Connectomic Profiling of Concussion Using Bayesian Machine Learning.” Https://Home.Liebertpub.Com/Neu, Apr. 2024. 140 Huguenot Street, 3rd Floor New Rochelle, NY 10801 USA, www.liebertpub.com, https://doi.org/10.1089/neu.2023.0509.

机器学习算法助力准确步长测量

特拉维夫大学和特拉维夫苏拉斯基医疗中心合作开发了一种基于机器学习的步长估算模型，可以通过佩戴在下背部的小型可穿戴传感器实现。研究团队利用惯性测量单元（IMU）系统，这种系统安装在每部手机和智能手表中，可以测量与步行相关的参数。他们通过收集472名不同病症患者（包括帕金森病、轻度认知障碍、健康老年人以及健康年轻人和多发性硬化患者）超过83,569步的IMU数据，训练了一系列机器学习模型来将IMU数据转化为步长估计。最终，XGBoost模型被证明是最准确的，其单步误差仅为6厘米，较传统模型的21厘米误差大幅减少。研究结果发表在npj Digital Medicine杂志上。

#神经技术 #npj Digital Medicine #步长测量 #机器学习 #可穿戴设备

阅读论文：

Zadka, Assaf, et al. “A Wearable Sensor and Machine Learning Estimate Step Length in Older Adults and Patients with Neurological Disorders.” Npj Digital Medicine, vol. 7, no. 1, May 2024, pp. 1–12. www.nature.com, https://doi.org/10.1038/s41746-024-01136-2.

突破语言模型适应的局限：分支合并法有效缓解灾难性遗忘

随着人工智能的快速发展，多语言模型的适应性已成为关键挑战之一。研究人员发现，尽管大型语言模型在英语中表现出色，但在适应较少使用的语言时性能急剧下降。传统的继续预训练和指令调整方法在防止模型在学习新语言时遗忘原有语言（即灾难性遗忘）上存在不足。

为解决这一问题，来自INSAIT、LogicStar.ai、苏黎世联邦理工学院、芝加哥大学及Together AI的研究团队提出了一种创新方法——分支合并（Branch-and-Merge, BAM）。BAM通过在不同的数据子集上并行微调多个模型，并在迭代中合并这些模型，有效降低权重变化的幅度，提高了学习效率。此外，BAM通过利用多个训练切片，确保了基础模型在原语言中的关键能力得到保留。

研究表明，BAM方法不仅显著减少了模型的遗忘问题，而且在目标语言的任务性能上也有所提升。例如，在对MISTRAL-7B和LLAMA-3-8B模型的测试中，BAM训练的LLAMA-3-8B模型在保加利亚语任务中的表现比标准训练提高了10.9%，在英语任务中也提高了1.3%。这一成果表明，BAM是一种对抗灾难性遗忘并有效适应多语言环境的强有力方法。

#人工智能 #多语言模型 #灾难性遗忘 #分支合并法 #语言适应性

阅读更多：

https://www.marktechpost.com/2024/07/14/branch-and-merge-method-enhancing-language-adaptation-in-ai-models-by-mitigating-catastrophic-forgetting-and-ensuring-retention-of-base-language-capabilities-while-learning-new-languages/

光纤神经网络：未来机器学习的可持续新途径

在最近由马克斯·普朗克光学科学研究所发表的一篇研究中，科学家们提出了一种新的光学系统实现神经网络的方法，这一方法未来可能使机器学习更为可持续。与以往的技术相比，这种新方法更为简单，可能大幅降低能源消耗和训练时间。

随着机器学习和人工智能应用的日益广泛，例如计算机视觉和文本生成，现有的神经网络需求急剧增加，一些网络的参数已达数十亿级别。例如，据估计训练GPT-3所消耗的能量超过1000兆瓦时，相当于一个小镇一天的电力消耗。这种趋势催生了对更快、更节能、成本更低的替代方案的需求。

新方法由马克斯·普朗克光学科学研究所的Clara Wanjura和Florian Marquardt提出。他们建议通过改变光的传输来印记输入数据，从而简化光场的处理方式。这种方法无需复杂的物理交互即可实现所需的数学运算。

该物理神经网络的评估和训练将变得非常简单，只需让光线通过系统并观察通过的光线即可。研究者们在模拟中证明，这种方法能够在图像分类任务中达到与数字神经网络同样的准确度。研究发表在Nature Physics上。

#光学神经网络 #机器学习 #可持续发展 #神经形态计算 #能源效率

阅读论文：

Wanjura, Clara C., and Florian Marquardt. “Fully Nonlinear Neuromorphic Computing with Linear Wave Scattering.” Nature Physics, July 2024, pp. 1–7. www.nature.com, https://doi.org/10.1038/s41567-024-02534-9.

提升人工智能模型信任度：MIT新技术更精准预测不确定性

随着人工智能技术的广泛应用，如何准确评估AI模型的不确定性成为了一个关键问题。麻省理工学院（MIT）的研究人员开发了一种新技术，能够有效地提高大型机器学习模型对其预测不确定性的精确度，这一进展可能帮助实践者在现实世界中更好地判断是否应信赖某个模型。

该技术名为IF-COMP，利用最小描述长度原理（MDL）和温度缩放统计技术，不仅提升了不确定性估计的准确性，还通过影响函数实现了快速计算，使之能够适用于处理庞大的深度学习模型。这些模型常见于医疗影像分析及其他安全关键领域，对准确度的要求极高。

研究表明，IF-COMP能够有效识别数据点的标记错误和异常值，通过提供更准确的不确定性信息，帮助用户做出更明智的决策。此外，该技术的模型无关性质意味着它可以广泛应用于多种类型的机器学习模型中。

MIT的研究团队计划将此技术扩展到大型语言模型等其他领域，进一步探索最小描述长度原理的潜在应用。这项研究不仅提升了机器学习模型的实用性和可靠性，也为未来AI技术的发展打开了新的可能。

#大型语言模型 #ChatGPT #代码生成 #NLP #软件工程

阅读论文：

Ng, Nathan, et al. Measuring Stochastic Data Complexity with Boltzmann Influence Functions. arXiv:2406.02745, arXiv, 4 June 2024. arXiv.org, https://doi.org/10.48550/arXiv.2406.02745.

人工智能聊天机器人存在“同理心缺失”，儿童用户面临潜在风险

研究由剑桥大学的Nomisha Kurian完成，研究显示，儿童在与AI互动时，容易出现理解偏差，进而导致潜在的危险情境。例如，2021年亚马逊的AI语音助手Alexa曾建议一名10岁儿童将硬币插入通电插座，2022年Snapchat的My AI则向一名假装成13岁女孩的成年研究人员提供了有关失去童贞的建议。

虽然这些公司随后实施了安全措施，但研究认为还需要在长远上采取更主动的措施，确保AI的设计初期就考虑到儿童安全问题。Kurian博士撰文指出，AI技术的巨大潜力需要负责任地进行创新。她建议开发人员应与教育工作者、儿童安全专家及年轻人密切合作，在整个设计周期中采取以儿童为中心的设计方法。

研究还提出了一个包含28项问题的框架，帮助教师、研究人员、政策制定者、家庭和开发人员评估和增强新AI工具的安全性。这些问题包括聊天机器人如何理解和解释儿童的语言模式，是否具有内容过滤和内置监控功能，以及是否鼓励儿童在遇到敏感问题时寻求成年人的帮助。

#人工智能 #同理心缺失 #儿童安全 #技术创新 #聊天机器人

阅读论文：

Kurian, Nomisha. “‘No, Alexa, No!’: Designing Child-Safe AI and Protecting Children from the Risks of the ‘Empathy Gap’ in Large Language Models.” Learning, Media and Technology, June 2024. world, www.tandfonline.com, https://www.tandfonline.com/doi/abs/10.1080/17439884.2024.2367052.

整理｜ChatGPT

编辑｜丹雀 & 存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体，旨在以科学追问为纽带，深入探究人工智能与人类智能相互融合与促进，不断探索科学的边界。如果您有进一步想要讨论的内容，欢迎评论区留言，或扫二维码添加小助手微信questionlab，加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院（Tianqiao and Chrissy Chen Institute, TCCl）是由陈天桥、雒芊芊夫妇出资10亿美元创建的全球最大私人脑科学研究机构之一，总部设在美国。

TCCI与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室；与加州理工学院合作成立了TCCI加州理工神经科学研究院。

TCCI建成了支持脑科学研究的生态系统，项目遍布欧美、亚洲和大洋洲，包括学术会议和交流、夏校培训、AI加速科学大奖、科研型临床医生奖励计划、特殊病例社区、中文媒体追问等。