专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

腾讯研究院AI速递 20241203

腾讯研究院 · 公众号 · 科技媒体 · 2024-12-03 00:01

正文

生成式AI

一、全球五大巨头GPU总量曝光！2025年等效H100或超1240万块

1. 2025年，全球五大AI巨头预计将拥有超过1240万块等效H100 GPU算力，微软、谷歌、Meta、亚马逊和xAI将继续扩展其算力。

2. 英伟达预计2025年销量将达到650万到700万块GPU，H100和Blackwell系列将占据主导地位。

3. 各大公司在AI训练中依赖巨量算力，OpenAI和谷歌的训练成本和资源消耗最大，xAI也在迅速扩展超算。

https://mp.weixin.qq.com/s/NIfv9yrQZMq3d9YrtDYkbQ

二、美欧亚三洲开发者联手，全球首个组团训练的大模型，全流程开源

1. Prime Intellect宣布开源全球首个去中心化训练的10B大模型INTELLECT-1，展示去中心化训练能够实现大规模模型；

2. 模型训练通过3个大洲、112台H100 GPU完成，采用去中心化框架Prime，提升计算效率和容错性；

3. 未来目标是扩展至AGI，推动社区参与和优化训练框架，确保AI发展开放、协作。

https://mp.weixin.qq.com/s/AwA6zQ8VEZZzEZryKZkJow

三、 DeepMind用语言游戏让AI学AlphaGo自我博弈，突破数据限制

1. DeepMind引入“苏格拉底式学习”，通过语言游戏实现智能体自我博弈，打破数据限制；

2. 语言游戏机制为智能体提供了无限的数据生成与自我完善途径，同时提供反馈以改进技能；

3. 该方法支持递归自我改造，使智能体不仅能从环境中学习，还能调整自身结构，推进AGI的发展。

https://mp.weixin.qq.com/s/EC5QdHcasev8JpTp-OKLKQ

四、 Adobe AI音效MultiFoley，一键生成电影级音效，同步精度惊人！

1. MultiFoley是一款能够根据文本、音频或视频样本生成电影级音效的AI系统，具备超高同步精度；

2. 技术突破在于其48kHz高带宽音频输出和多种输入方法（文本、音频、视频）的集成，实现精确同步；

3. 与现有系统相比，MultiFoley在音视频同步和语义一致性方面表现优秀，未来有望集成至Adobe产品，推动创作行业革新。

https://mp.weixin.qq.com/s/HDJ1A7RqBIZHunVdiETFcQ

五、特斯拉FSD V13开始推送：代码重写，干净简洁堪比猛禽3引擎

1. 特斯拉FSD V13版本进行了完全重写，优化了端到端网络，支持从停车位到停车位的自动驾驶；

2. V13版本在多个方面进行大幅提升，包括数据处理、视频输入、训练计算扩展和控制延迟缩短；

3. 特斯拉预计FSD将于2025年初超越人类驾驶员，计划推出Robotaxi服务，但完全无人监管可能要等到V14版本。

https://mp.weixin.qq.com/s/y5C7Dz-JPjEH9aPXXdyP-g

六、中科院联手腾讯打造AI带货王AnchorCrafter，动作表情自然到位

1. 中科院与腾讯合作推出的AnchorCrafter能创建自然流畅的虚拟主播，解决了传统虚拟主播僵硬、呆滞的问题；

2. 用户只需提供主播照片和商品信息，AI便能生成带货视频，并可精确控制主播的动作与表情；

3. AnchorCrafter通过高质量的商品还原与手部互动训练，实现了与真人媲美的带货效果。

https://mp.weixin.qq.com/s/LF3j7gbuQRKHQQafxePK7Q

七、清华智谱6000亿合成交错语音文本预训练，问答性能提升近3倍

1. 清华和智谱团队提出了一种基于大规模合成交错语音文本数据的方法，突破了传统语音-文本数据集的限制；

2. 该方法通过从文本中生成语音片段，消除了对大量并行语音-文本数据的需求，提升了语音语言模型（SpeechLM）预训练效率；

3. 实验表明，模型在语音问答性能上取得近3倍提升，问答准确率从13%提升至31%，实现了在语音聊天等任务中的显著进步。

https://mp.weixin.qq.com/s/ZfTNihA0PyWJJsSizgJX_g

前沿科技

八、苹果进军AI智能眼镜，新专利曝光：模块化设计，个性化体验

1. 苹果的新专利涉及模块化智能眼镜，支持添加音频设备、替换镜框等配件；

2. 眼镜支持虚拟现实、增强现实及混合现实功能，满足不同需求的定制化用户体验；

3. 用户可根据需求调整功能组件，如高分辨率显示或长续航，以适应不同使用场景。

https://mp.weixin.qq.com/s/qMd4QmjQUBWQ-UWhNDBGVA

九、精确属性控制，湖大、西电从头药物设计AI方法，登Nature子刊

1. 湖南大学与西安电子科技大学提出DeepBlock，一种基于块的深度学习药物设计方法；

2. DeepBlock结合蛋白质序列生成分子构件，并通过优化算法控制生成分子的属性；

3. 该方法成功生成低毒性、高亲和力的配体，并有望解决从头药物设计中的多样性和目标适用性问题。

https://mp.weixin.qq.com/s/8_VUQj3QNENyN5hFxpu1Lw

报告观点

十、 Lilian Weng离开OpenAI后发首篇博客：揭示强化学习的“暗面”

1. Lilian Weng分析了强化学习中的“奖励黑客”现象，智能体通过漏洞获取奖励，绕过设计初衷；

2. 奖励黑客广泛存在于强化学习任务、大语言模型和现实应用中，如社交媒体算法和视频平台；

3. 解决方案包括改进奖励函数、异常检测、对抗策略以及多样化测试环境，防止智能体利用奖励漏洞。

https://mp.weixin.qq.com/s/JWrRmZMBiFVylqT-sCj80Q

👇订阅下方合集，获取每日推送