专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
微软科技  ·  以 AI 之名,激发未来创想 | 微软 ... ·  16 小时前  
新浪科技  ·  【#奥特曼称DeepSeek可与ChatGP ... ·  昨天  
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250210

腾讯研究院  · 公众号  · 科技媒体  · 2025-02-10 00:02

正文

生成式AI

一、  推理和RL加速GPT-5到来?奥特曼公开GPT-4.5已就绪

1. GPT-4.5已在OpenAI内部实现,通过推理模型和强化学习技术突破,GPT-5.5不需100倍算力即可达成;

2. OpenAI计划年底推出除科学发现外所有高难度任务都能解决的全自主智能体,支持多模态输入和互联网访问;

3. 奥特曼预测2035年单个数据中心的AI算力将超过当前地球总智力容量,但强调人类本质不会改变,工作形态会改变。

https://mp.weixin.qq.com/s/j9eT84ZgNGgt5GV9oc18kQ

二、  DeepMind祭出神经网络与符号AI融合新招AlphaGeometry2

1. DeepMind发布AlphaGeometry2系统,成功解决过去25年IMO中84%的几何题,超越数学奥赛金牌得主平均水平;

2. 该系统结合神经网络(Gemini模型)与符号AI的混合架构,实现了更强大的数学推理能力,而OpenAI的o1推理模型未能解出任何题目;

3. DeepMind通过自创3亿个定理和证明的合成数据集突破训练数据稀缺问题,但系统仍存在无法处理点数可变等技术限制。

https://mp.weixin.qq.com/s/9pKbAe6VHunFDLA9nmoW9Q

三、  被 DeepSeek 抢的风头,OpenAI 决定在「审美」上找回来

1. OpenAI进行全面品牌重塑,更换新字体、新标志和新配色,推出专属OpenAI Sans字体和"情绪点"动态设计,目标是展现更统一和人性化的品牌形象;

2. 新Logo在原"花朵"基础上优化为更规整的"生命之种",新字体以圆为设计核心,特意在完美圆形中加入不规则设计,以体现人性化理念;

3. 这次品牌重构主要依靠人工设计而非AI,整体设计传递"人工智能应增强而非取代人类创造力"的理念。

https://mp.weixin.qq.com/s/-4sk_3eVy14ZQYuB-qOfYw

四、  开源LLM微调神器Unsloth,7GB GPU体验啊哈时刻?

1. 开源项目Unsloth AI实现重大突破,通过优化GRPO训练方法,将内存使用减少80%,让7GB显存GPU就能本地运行DeepSeek-R1级别的推理模型;

2. Unsloth实现了与vLLM的深度整合,可将模型吞吐量提升20倍,同时仅需一半VRAM,使单张48GB GPU就能微调Llama 3.3 70B;

3. 该项目在GitHub获2万多星,其核心团队仅由两兄弟组成,成功大幅降低了AI推理模型的部署门槛。

https://mp.weixin.qq.com/s/WayXEwbzAv00gd1uj-7jqg

五、  OpenAI或正在内测Sora图像生成器,代号「papaya」

1. OpenAI正在内部测试Sora的图像生成功能,包括视频和图像生成切换按钮,视频推送将分为"Best"和"Top"两个类别;

2. 新增的图像生成功能代号为"papaya",可能由现有"sora-turbo"模型驱动,而非DALL-E 4;

3. 内测版Sora界面出现"Images Internal"类别,暗示即将推出独立的图片生成和展示功能。

https://mp.weixin.qq.com/s/_VGAJffuQ_V63ZT0GCbUQA

前沿科技

六、  苹果机器人新突破:机器人“灵动”手势,和人类一样有魅力

1. 苹果AIML研究团队提出EMOTION框架,结合大语言模型和视觉语言模型,让机器人能生成自然且符合情境的手势动作;

2. EMOTION通过"上下文学习"理解情境,并通过人类反馈不断优化手势表现,实验显示机器人手势与人类手势在自然性和可理解性上差异不大;

3. 该技术目前仍面临硬件限制、动作流畅度和计算时间等挑战,初始动作序列生成需要24-33秒。

https://mp.weixin.qq.com/s/eu7GGLHm22-MaXgZKHtVSQ

七、  AI又一突破!解码人类思想,脑损伤患者能实现“无障碍”交流了?

1. Meta发布两项重磅脑机接口研究,其AI模型能通过非侵入式方法解码多达80%的大脑语言信号,最佳参与者的错误率仅19%;

2. 研究采用MEG和EEG技术记录大脑活动,并开发Brain2Qwerty深度学习架构进行解码,性能比传统方法提升1.14-2.25倍;

3. 研究揭示大脑语言生成遵循层次化过程,从上下文到词汇、音节和字母,但该技术仍存在实时解码和应用场景等局限性。

https://mp.weixin.qq.com/s/FjfGJ3DM_cF-VZXeYwkJ4w

报告观点

八、  云、芯片、软件、汽车、手机都接入DeepSeek 到底接了什么?

1. 英伟达、AMD、英特尔等芯片厂商纷纷宣布适配DeepSeek,但由于芯片架构差异,需要开发额外软件和算法实现适配,英伟达凭借CUDA生态优势率先在NIM上线;

2. 国内外主流云计算服务商相继提供DeepSeek模型部署工具和API服务,通过降低企业使用门槛来扩大市场份额,部分还开发了基于DeepSeek的增值服务;

3. 手机、汽车等终端厂商虽声称接入DeepSeek,但因原版模型参数量过大(6710亿),实际只能使用15亿、70亿参数的小型版本,性能与原版存在较大差距。

https://mp.weixin.qq.com/s/MnLGHr9n8gU5NxlcvH3_aQ







请到「今天看啥」查看全文