专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

腾讯研究院AI速递 20250318

腾讯研究院 · 公众号 · 科技媒体 · 2025-03-18 00:01

正文

生成式AI

一、 Claude将推出能直接读取本地文件的 Agent功能Harmony

1. Harmony功能将允许Claude直接读取并编辑用户本地文件，可扫描目录、打开文件、编辑内容并显示差异；

2. Claude的新功能可能挑战同样使用Claude模型的代码编辑器Cursor，后者需提供更多独特功能保持竞争力；

3. AI工具格局将因此改变，让AI更深入参与用户工作流程，使各工具边界模糊，最终有利于用户体验提升。

二、迁移DeepSeek-R1同款算法，小米7B模型刷新音频理解榜

1. 小米团队使用DeepSeek-R1的GRPO强化学习算法，让7B参数的Qwen2-Audio模型在MMAU音频理解评测中达到64.5%准确率；

2. 实验证明强化学习在3.8万条数据上的表现远超监督学习在57万条数据上的结果，小参数模型也能展现强推理能力；

3. 研究发现音频理解任务存在明显的"生成-验证差距"，强化学习的优势明显，而显式思维链输出反而降低了模型性能。

三、零一万物发布模型一体机，提供企业DeepSeek部署定制

1. 李开复任CEO的零一万物成为首家全面采用DeepSeek模型的"六小虎"公司，推出万智企业大模型一站式平台提供DeepSeek部署定制方案；

2. 平台提供"三步走"落地方案：一体机部署（预装华为昇腾GPU）、集成API应用、行业定制（支持企业上传知识库和模型微调）；

3. 李开复预测2025年为中国AI-First应用爆发年，零一万物将保持轻量化模型研发，但不再进行万亿参数级超大模型预训练。

四、百度文心大模型4.5和文心大模型X1发布，官网同步上线

1. 百度发布两款新大模型：文心大模型4.5（多模态）和文心大模型X1（推理模型），均已在官网上线可免费体验；

2. 文心大模型4.5在测评中表现对标GPT-4o，应用了FlashMask动态注意力掩码等关键技术提升多模态能力；

3. 文心大模型X1能"自主运用工具"，百度承诺后续将开源文心大模型，年内发布5.0版本。

五、两高中生打造AI卡路里应用，500万下载，8人团队赚千万

1. 两名18岁高中毕业生Zach和Henry开发的卡路里识别App"Cal AI"上线8个月下载量突破500万，月收入声称达200万美元；

2. 产品核心为AI食物识别计算热量技术，结合OpenAI、Anthropic大模型与RAG技术，自研算法解决混合食材识别难题；

3. 创始人Zach有丰富编程经验，16岁时已通过开发绕过学校封锁的游戏网站"Totally Science"赚到10万美元，目前8人团队运营产品。

六、机器人「安卓」时刻来了？行业首个通用具身智能平台亮相

1. 北京人形机器人创新中心发布全球首个通用具身智能平台"慧思开物"，支持多本体多场景应用，颠覆传统机器人开发模式；