专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

腾讯研究院AI速递 20250224

腾讯研究院 · 公众号 · 科技媒体 · 2025-02-24 00:01

主要观点总结

本篇文章对近期生成式AI领域的主要发展进行了总结，包括各种大模型的发布、新技术和应用的出现以及AI在教育领域的普及等。

关键观点总结

关键观点1: xAI、DeepSeek、亚马逊等科技巨头的新品发布。

介绍了各大科技公司在AI领域的新动作，包括语音和记忆功能、代码库开源、AI重大升级等。

关键观点2: Moonlight模型基于Muon优化器的特点和应用。

详细解释了Muon优化器的工作原理及其在模型训练中的应用，包括大规模模型训练的实现和性能提升。

关键观点3: Google的AI视频模型Veo 2的特点和用途。

描述了Google最新发布的AI视频模型Veo 2的真实感、细节丰富和动画流畅等特点，以及其在Freepik平台上的开放使用和免费体验权限的提供。

关键观点4: Figure机器人加载自研Helix模型的功能和优势。

介绍了Figure AI发布的首个通用视觉-语言-行动模型Helix，以及其通过自然语言控制人形机器人的功能，以及模型架构和训练数据的使用。

关键观点5: 腾讯元宝接入DeepSeek和混元模型的新功能。

阐述了腾讯元宝新版本通过接入DeepSeek和混元模型实现图片内容理解和分析的功能，以及多模态理解方面的优势。

关键观点6: Neo Gamma人形机器人的特点和用途。

描述了Neo Gamma人形机器人的柔软外壳、情感式耳环、低噪音等特点，以及其完成家务任务的能力和应用场景。

关键观点7: AI在编程领域的影响和误区的讨论。

探讨了新一代开发者过度依赖AI工具的现象，以及AI对编程思维培养的影响，同时提供了对AI发展的误区的解读。

关键观点8: OpenAI的用户增长和AI教育的普及。

介绍了ChatGPT的用户增长情况，以及AI在教育领域的普及趋势，包括高校与OpenAI的合作以及AI工具在教育和职场的广泛应用。

正文

生成式AI

一、本周大模型诸神混战！DeepSeek等和美国巨头对打

1. xAI、DeepSeek、亚马逊将在下周密集发布新品：Grok 3推出语音和记忆功能、DeepSeek开源五个代码库、Alexa进行AI重大升级；

2. OpenAI计划发布GPT-4.5和GPT-5，时间节点分别为下周和5月下旬，后者将与谷歌I/O开发者大会正面交锋；

3. 阿里将发布基于Qwen2.5-Max的深度推理模型，同时开源新一代视频生成模型WanX 2.1；Anthropic即将推出思考模型。

https://mp.weixin.qq.com/s/PbLRx-sVskEyx2KwExE64A

二、月之暗面开源MoE模型Moonlight，基于Muon优化器

1. Muon优化器采用矩阵正导化技术，通过均衡参数更新方向，将模型训练效率提升至AdamW的2倍；

2. 该优化器通过加入权重衰减和智能调整参数更新尺度两大关键技术，成功实现大规模模型训练；

3. 基于Muon训练的Moonlight模型在MMLU测试中突破性能边界，并已将全部代码、模型和技术报告开源。

https://mp.weixin.qq.com/s/P-fQJfF4iEU8Q9R2SEjlSQ

三、 Google “核弹级”AI视频模型Veo 2在Freepik首发

1. Google最新发布的AI视频模型Veo2在Freepik平台首发，具有真实感强、细节丰富、动画流畅等特点；

2. 该模型将通过Freepik平台面向全球设计师、视频制作者等创意群体开放使用；

3. Veo2提供首批10000名用户免费体验权限，用户可通过Freepik平台的AI视频生成器页面申请。

https://mp.weixin.qq.com/s/MjjA35XukLt4qb2h4PB4Tw

四、 Figure机器人加载自研Helix模型，「拿捏」各类用品

1. Figure AI发布首个通用视觉-语言-行动模型Helix，可通过自然语言直接控制人形机器人整个上半身操作；

2. Helix采用"系统1、系统2"架构，将VLM语言理解与快速反应视觉运动策略相结合，实现200Hz高速精确控制；

3. 该模型经500小时训练数据即可实现对未见过物品的操控，并支持双机器人协作，已可用于商业部署。

https://mp.weixin.qq.com/s/RH97HQ879ATrKVms0dz3YA

五、腾讯元宝上线DeepSeek新功能，能够理解图片信息

1. 腾讯元宝新版本接入DeepSeek和混元模型，实现图片内容的理解和分析功能，不再局限于文字识别；

2. 新版本在多模态理解方面表现出色，能准确描述图片场景、进行深度推理，提升复杂问题推理能力；

3. 腾讯元宝近期频繁更新，已实现DeepSeek-R1满血版、混元T1等多个模型的接入，支持图片理解、文件解析和联网搜索等功能。

https://mp.weixin.qq.com/s/XVI-5EZGxmz7i65OZSuAMg

前沿科技

六、干完几星期家务，1X新款人形机器人亮相，和冰箱一样安静

1. Neo Gamma人形机器人配备柔软外壳和情感式耳环，噪音降至冰箱水平，可完成煮咖啡、洗衣等家务；

2. 采用强化学习控制系统和远程算法结合，实现自然走路、坐姿等动作，具备视觉操作模型可处理未见过的场景；

3. 1X公司以家庭场景为首要应用目标，区别于其他公司主攻工业场景的策略，获得OpenAI早期支持。

https://mp.weixin.qq.com/s/EYMYHDr4tOKHwYyHHmWXyw

报告观点

七、新一代码农或不会写代码了，AI正培养「文盲程序员」！

1. 14岁编程天才Namanyay观察到新一代开发者过度依赖AI工具，能交付代码但对底层原理理解不足；

2. 传统StackOverflow问答过程虽慢但能获得深度理解，而AI提供的快速解答难以培养真正的编程思维；

3. 作者建议开发者以学习心态使用AI、加入技术社群、重视代码审查和从零构建项目，在效率和深度理解间寻求平衡。

https://mp.weixin.qq.com/s/sVRUa1pHPPaV0_c12im66Q