生成式AI
一、 Claude将推出能直接读取本地文件的 Agent功能Harmony
1. Harmony功能将允许Claude直接读取并编辑用户本地文件,可扫描目录、打开文件、编辑内容并显示差异;
2. Claude的新功能可能挑战同样使用Claude模型的代码编辑器Cursor,后者需提供更多独特功能保持竞争力;
3. AI工具格局将因此改变,让AI更深入参与用户工作流程,使各工具边界模糊,最终有利于用户体验提升。
https://mp.weixin.qq.com/s/LsxCsNr0h4woOrOhagbOdA
二、 迁移DeepSeek-R1同款算法,小米7B模型刷新音频理解榜
1. 小米团队使用DeepSeek-R1的GRPO强化学习算法,让7B参数的Qwen2-Audio模型在MMAU音频理解评测中达到64.5%准确率;
2. 实验证明强化学习在3.8万条数据上的表现远超监督学习在57万条数据上的结果,小参数模型也能展现强推理能力;
3. 研究发现音频理解任务存在明显的"生成-验证差距",强化学习的优势明显,而显式思维链输出反而降低了模型性能。
https://mp.weixin.qq.com/s/S6AooleJs56Gv67vxWV9Jw
三、 零一万物发布模型一体机,提供企业DeepSeek部署定制
1. 李开复任CEO的零一万物成为首家全面采用DeepSeek模型的"六小虎"公司,推出万智企业大模型一站式平台提供DeepSeek部署定制方案;
2. 平台提供"三步走"落地方案:一体机部署(预装华为昇腾GPU)、集成API应用、行业定制(支持企业上传知识库和模型微调);
3. 李开复预测2025年为中国AI-First应用爆发年,零一万物将保持轻量化模型研发,但不再进行万亿参数级超大模型预训练。
https://mp.weixin.qq.com/s/gztL3MRFyD-secBJQKzmBw
四、 百度文心大模型4.5和文心大模型X1发布,官网同步上线
1. 百度发布两款新大模型:文心大模型4.5(多模态)和文心大模型X1(推理模型),均已在官网上线可免费体验;
2. 文心大模型4.5在测评中表现对标GPT-4o,应用了FlashMask动态注意力掩码等关键技术提升多模态能力;
3. 文心大模型X1能"自主运用工具",百度承诺后续将开源文心大模型,年内发布5.0版本。
https://mp.weixin.qq.com/s/-nBhMngQk6txAEgybJVlvg
五、 两高中生打造AI卡路里应用,500万下载,8人团队赚千万
1. 两名18岁高中毕业生Zach和Henry开发的卡路里识别App"Cal AI"上线8个月下载量突破500万,月收入声称达200万美元;
2. 产品核心为AI食物识别计算热量技术,结合OpenAI、Anthropic大模型与RAG技术,自研算法解决混合食材识别难题;
3. 创始人Zach有丰富编程经验,16岁时已通过开发绕过学校封锁的游戏网站"Totally Science"赚到10万美元,目前8人团队运营产品。
https://mp.weixin.qq.com/s/KcXzoVOYC8tT7aitlLwKZA
六、 机器人「安卓」时刻来了?行业首个通用具身智能平台亮相
1. 北京人形机器人创新中心发布全球首个通用具身智能平台"慧思开物",支持多本体多场景应用,颠覆传统机器人开发模式;