专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
凤凰网科技  ·  DeepSeek扔的第二枚开源王炸到底是什么? ·  12 小时前  
新浪科技  ·  【#1岁橘猫寄养10天后患猫瘟死亡#】#橘猫 ... ·  16 小时前  
凤凰网科技  ·  2030超SpaceX?中国商业航天弯道超车进行时 ·  昨天  
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250224

腾讯研究院  · 公众号  · 科技媒体  · 2025-02-24 00:01

主要观点总结

本篇文章对近期生成式AI领域的主要发展进行了总结,包括各种大模型的发布、新技术和应用的出现以及AI在教育领域的普及等。

关键观点总结

关键观点1: xAI、DeepSeek、亚马逊等科技巨头的新品发布。

介绍了各大科技公司在AI领域的新动作,包括语音和记忆功能、代码库开源、AI重大升级等。

关键观点2: Moonlight模型基于Muon优化器的特点和应用。

详细解释了Muon优化器的工作原理及其在模型训练中的应用,包括大规模模型训练的实现和性能提升。

关键观点3: Google的AI视频模型Veo 2的特点和用途。

描述了Google最新发布的AI视频模型Veo 2的真实感、细节丰富和动画流畅等特点,以及其在Freepik平台上的开放使用和免费体验权限的提供。

关键观点4: Figure机器人加载自研Helix模型的功能和优势。

介绍了Figure AI发布的首个通用视觉-语言-行动模型Helix,以及其通过自然语言控制人形机器人的功能,以及模型架构和训练数据的使用。

关键观点5: 腾讯元宝接入DeepSeek和混元模型的新功能。

阐述了腾讯元宝新版本通过接入DeepSeek和混元模型实现图片内容理解和分析的功能,以及多模态理解方面的优势。

关键观点6: Neo Gamma人形机器人的特点和用途。

描述了Neo Gamma人形机器人的柔软外壳、情感式耳环、低噪音等特点,以及其完成家务任务的能力和应用场景。

关键观点7: AI在编程领域的影响和误区的讨论。

探讨了新一代开发者过度依赖AI工具的现象,以及AI对编程思维培养的影响,同时提供了对AI发展的误区的解读。

关键观点8: OpenAI的用户增长和AI教育的普及。

介绍了ChatGPT的用户增长情况,以及AI在教育领域的普及趋势,包括高校与OpenAI的合作以及AI工具在教育和职场的广泛应用。


正文

生成式AI

一、  本周大模型诸神混战!DeepSeek等和美国巨头对打

1. xAI、DeepSeek、亚马逊将在下周密集发布新品:Grok 3推出语音和记忆功能、DeepSeek开源五个代码库、Alexa进行AI重大升级;

2. OpenAI计划发布GPT-4.5和GPT-5,时间节点分别为下周和5月下旬,后者将与谷歌I/O开发者大会正面交锋;

3. 阿里将发布基于Qwen2.5-Max的深度推理模型,同时开源新一代视频生成模型WanX 2.1;Anthropic即将推出思考模型。

https://mp.weixin.qq.com/s/PbLRx-sVskEyx2KwExE64A

二、  月之暗面开源MoE模型Moonlight,基于Muon优化器

1. Muon优化器采用矩阵正导化技术,通过均衡参数更新方向,将模型训练效率提升至AdamW的2倍;

2. 该优化器通过加入权重衰减和智能调整参数更新尺度两大关键技术,成功实现大规模模型训练;

3. 基于Muon训练的Moonlight模型在MMLU测试中突破性能边界,并已将全部代码、模型和技术报告开源。

https://mp.weixin.qq.com/s/P-fQJfF4iEU8Q9R2SEjlSQ

三、  Google “核弹级”AI视频模型Veo 2在Freepik首发

1. Google最新发布的AI视频模型Veo2在Freepik平台首发,具有真实感强、细节丰富、动画流畅等特点;

2. 该模型将通过Freepik平台面向全球设计师、视频制作者等创意群体开放使用;

3. Veo2提供首批10000名用户免费体验权限,用户可通过Freepik平台的AI视频生成器页面申请。

https://mp.weixin.qq.com/s/MjjA35XukLt4qb2h4PB4Tw

四、  Figure机器人加载自研Helix模型,「拿捏」各类用品

1. Figure AI发布首个通用视觉-语言-行动模型Helix,可通过自然语言直接控制人形机器人整个上半身操作;

2. Helix采用"系统1、系统2"架构,将VLM语言理解与快速反应视觉运动策略相结合,实现200Hz高速精确控制;

3. 该模型经500小时训练数据即可实现对未见过物品的操控,并支持双机器人协作,已可用于商业部署。

https://mp.weixin.qq.com/s/RH97HQ879ATrKVms0dz3YA

五、  腾讯元宝上线DeepSeek新功能,能够理解图片信息

1. 腾讯元宝新版本接入DeepSeek和混元模型,实现图片内容的理解和分析功能,不再局限于文字识别;

2. 新版本在多模态理解方面表现出色,能准确描述图片场景、进行深度推理,提升复杂问题推理能力;

3. 腾讯元宝近期频繁更新,已实现DeepSeek-R1满血版、混元T1等多个模型的接入,支持图片理解、文件解析和联网搜索等功能。

https://mp.weixin.qq.com/s/XVI-5EZGxmz7i65OZSuAMg

前沿科技

六、  干完几星期家务,1X新款人形机器人亮相,和冰箱一样安静

1. Neo Gamma人形机器人配备柔软外壳和情感式耳环,噪音降至冰箱水平,可完成煮咖啡、洗衣等家务;

2. 采用强化学习控制系统和远程算法结合,实现自然走路、坐姿等动作,具备视觉操作模型可处理未见过的场景;

3. 1X公司以家庭场景为首要应用目标,区别于其他公司主攻工业场景的策略,获得OpenAI早期支持。

https://mp.weixin.qq.com/s/EYMYHDr4tOKHwYyHHmWXyw

报告观点

七、  新一代码农或不会写代码了,AI正培养「文盲程序员」!

1. 14岁编程天才Namanyay观察到新一代开发者过度依赖AI工具,能交付代码但对底层原理理解不足;

2. 传统StackOverflow问答过程虽慢但能获得深度理解,而AI提供的快速解答难以培养真正的编程思维;

3. 作者建议开发者以学习心态使用AI、加入技术社群、重视代码审查和从零构建项目,在效率和深度理解间寻求平衡。

https://mp.weixin.qq.com/s/sVRUa1pHPPaV0_c12im66Q







请到「今天看啥」查看全文