专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
腾讯研究院  ·  腾讯研究院AI速递 20250109 ·  昨天  
腾讯研究院  ·  腾讯研究院AI速递 20250108 ·  2 天前  
36氪  ·  暴涨超1100亿!上汽集团,爆了! ·  3 天前  
新浪科技  ·  #奥特曼称OpenAI知道如何构建AGI#【 ... ·  3 天前  
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250109

腾讯研究院  · 公众号  · 科技媒体  · 2025-01-09 00:02

主要观点总结

本篇文章包含多个子话题,涉及生成式AI、世界模型平台、智能眼镜显示交互、AI眼镜、模型训练效率、3D生成模型、CES2025的黑科技、黄仁勋关于AI的沟通会内容,智源发布的AI技术趋势以及伯克利教授罗素的AGI预测等。

关键观点总结

关键观点1: 生成式AI的发展及挑战

包括OpenAI推出的计算机操作智能体以及其他公司的AI模型,讨论了生成式AI的发展情况,包括面临的安全问题和利润抉择困境。

关键观点2: 世界模型平台介绍及功能

介绍了英伟达发布的Cosmos世界模型平台,包括其包含的开源模型、采用的技术以及华人团队的贡献等。

关键观点3: 智能眼镜显示交互技术

包括苹果和雷鸟推出的智能眼镜的功能和技术特点,如多层显示技术、AI响应速度提升等。

关键观点4: 模型训练效率的提升

介绍了陈丹琦团队提出的MeCo训练方法,通过添加URL元数据调节提高模型性能,减少训练数据的需求。

关键观点5: 专业领域的3D生成模型进展

包括Meta与牛津发布的PartGen模型,可用于零部件级的3D生成,及其在14万艺术资产上的训练成果。

关键观点6: CES 2025的黑科技展示

介绍了在CES 2025展会上展示的一些炫酷黑科技,包括智能硬件的创新展示。

关键观点7: 行业专家对AI未来的看法

包括黄仁勋和伯克利教授罗素对AI未来发展的观点和预测,涉及AGI的影响、全球变革以及AI安全治理等问题。


正文

生成式AI

一、  OpenAI跟进,或将在本月就会发布自家的「计算机操作智能体」

1. OpenAI计划本月推出"Operator"AI智能体,晚于竞品发布,因担忧提示注入攻击;

2. 智能体执行任务时,屏幕截图内容可能遭恶意利用,诱导模型执行危险指令;

3. Anthropic采用虚拟机隔离数据的方案并不被认为稳妥,初创公司在安全与利润间存在抉择困境。

https://mp.weixin.qq.com/s/qEaUpiH9K0w6WNA82-UWTQ

二、  黄仁勋圈重点的世界模型平台是个啥?技术全解析,华人成主力

1. 英伟达发布Cosmos世界模型平台,包含8个开源模型,可生成物理世界真实数据供机器人和自动驾驶使用;

2. Cosmos采用扩散和自回归两类模型,在2000万小时视频上训练,支持文本生成视频和文本+视频生成视频;

3. 平台采用预训练+后训练模式,通过视频Tokenizer和护栏系统提升效果和安全性,华人团队贡献显著。

https://mp.weixin.qq.com/s/-gtGJSZHGm2fzkAyU3s3ew

三、  苹果AI眼镜显示交互曝光,疯狂申请专利!三层显示技术加持

1. 苹果获得智能眼镜三层显示专利,包含高分辨率主屏、低分辨率副屏和LED指示系统,支持多场景应用;

2. 眼镜具备多种功能:副屏预览信息、AirTag精准寻物、健康监测、FaceTime情绪可视化等;

3. 苹果另获眼镜固定臂系统专利,通过弹性元件和塑性变形设计,确保运动时眼镜稳固佩戴。

https://mp.weixin.qq.com/s/e5g5Z2TQ3BUEp2SHCtAXug

四、  AI眼睛卷起来,硬刚Meta!雷鸟AI眼镜登场,更轻盈更平价

1. 雷鸟发布V3 AI眼镜,搭载高通AR1芯片,39克超轻机身,售价1799元起,较Meta眼镜便宜近千元;

2. 产品集成通义系列大模型,强调AI响应速度,支持三年免费更新;

3. 联合TCL研发"猎鹰影像"系统,投入过亿资金改进相机性能,达到3000元价位手机画质。

https://mp.weixin.qq.com/s/uWsKChwoeAvjCsxJTclF7Q

五、  少用33%数据,模型性能不变,陈丹琦团队用元数据来做降本增效

1. 陈丹琦团队提出MeCo训练方法,通过添加URL元数据调节,使模型减少33%训练数据仍维持相同性能;

2. MeCo可通过URL引导模型行为,如使用factquizmaster.com提升常识任务表现6%,wikipedia.org降低有毒生成;

3. MeCo与多种元数据兼容,基于90%条件训练和10%冷却阶段的设计,几乎不增加计算开销。

https://mp.weixin.qq.com/s/CUKPJ3WYQit3aGaNTobiGg

六、  剑指专业领域零部件级3D生成!Meta联手牛津推出全新模型

1. Meta与牛津发布PartGen模型,可将3D生成物体分解为可独立操作的零部件级结构;

2. 采用两阶段方案:先用多视图生成器分割零件,再通过上下文补全模型还原完整部件形态;

3. 在14万艺术资产上训练,支持文本和图像输入,可实现零部件编辑、替换及形状纹理修改。

https://mp.weixin.qq.com/s/sl1XvbN-uHBVUldX6gpynA

前沿科技

七、  CES 2025 Day One: 十大炫酷黑科技,智能硬件颠覆想象!

1. 三星展示透明MicroLED和可伸缩屏幕;自收缩键盘和智能眼镜创新显示交互;

2. 智能机器人领域亮点纷呈:Mirumi情感陪伴机器人、轮椅助力机器人、Roborock带机械臂扫地机器人;

3. 新型智能设备不断创新:OMNIA全方位健康监测镜、Nuwa数字化笔记、无弦智能吉他打开应用新场景。

https://mp.weixin.qq.com/s/YA_yZJm_c25-GpnvVhLJdQ

报告观点

八、  黄仁勋一口气回答了业界最关注的20个问题,沟通会完整版   

1. 产品与技术战略:AI PC表现不及预期因云端优势明显;Blackwell性能大幅提升;RTX 5090定价策略针对高端用户;新一代AI系统Cosmos将成为理解物理世界的基础模型;

2. AI行业发展趋势:渲染技术仍是游戏画面生成基石;推理成本将随算力提升而降低;AI助手将成为超级智能帮手;未来汽车将全面具备自动驾驶能力;

3. 市场布局与竞争:与以色列深化合作发展;与企业级软件商共建生态;积极应对DirectX技术挑战;中国电动车企创新推动全球变革。

https://mp.weixin.qq.com/s/qEMs1jzXHFHRQXvhuTf0IQ

九、  智源发布2025十大AI技术趋势,具身、Super APP、AI安全

1. AI将深刻改变科学研究方法,具身智能迎来爆发元年,原生多模态大模型将带来更高效AI;

2. 合成数据成大模型迭代关键,推理优化加速落地,Agentic AI重塑产品形态,AI超级应用即将爆发;

3. 世界模型加强因果推理将成为多模态大模型下一阶段,AI安全治理体系需持续完善。

https://mp.weixin.qq.com/s/BiLIEr-vnmegGxvWvEUDnA

十、  伯克利对齐大师罗素:AGI 会所有人达到西方中产的生活水平

1. 伯克利教授罗素预测AGI将使全球GDP增长10倍,让所有人达到西方中产生活水平,但现有黑盒式AI系统难以控制;

2. 当前深度学习需大量训练数据,无法通过简单放大规模实现AGI,需在算术运算等基础能力上突破;

3. AI系统应以促进人类偏好为目标,但如何平衡80亿人的利益,以及AI与人类如何和谐共存仍是难题。

https://mp.weixin.qq.com/s/ume7Lb-snoPAnZUH3wBtfg

AI50节选

👇订阅下方合集,获取每日推送