专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

腾讯研究院AI速递 20250227

腾讯研究院 · 公众号 · 科技媒体 · 2025-02-27 00:02

正文

生成式AI

一、 DeepSeek Day 3：DeepGEMM 300行代码优化内核超专家

1. DeepSeek开源DeepGEMM库，仅300行代码超越专家优化内核，支持稠密和MoE模型，在Hopper GPU上实现高达1350+ FP8 TFLOPS算力；

2. DeepGEMM采用完全即时编译设计、细粒度缩放技术和多项创新优化方法，在多种矩阵形状下性能提升显著；

3. DeepSeek-R2或提前5月前发布，将实现更好的编码能力，并支持英语外的多语言推理。

二、 OpenAI Deep Research已向所有付费用户开放，系统卡发布

1. OpenAI向所有付费用户（刚发布时仅 Pro 用户可用）开放Deep Research功能，该智能体基于o3正式版模型，能综合互联网信息完成复杂研究任务；

2. OpenAI发布Deep Research系统卡，详述其训练数据、安全测试和风险评估，首次将模型在网络安全风险评级为"中等风险"；

3. Deep Research通过外部红队评估和准备度框架评估，能执行网页浏览、数据分析、Python代码等多步骤任务，在SWE-Lancer测试中表现优异。

三、谷歌推出免费Gemini 2.0代码助手，每月18万次代码补全

1. 谷歌宣布全球推出免费版Gemini Code Assist编程助手，提供每月180,000次代码补全，远超其他免费工具的2,000次限制；

2. 该工具基于Gemini 2.0大模型，支持所有公共领域编程语言，拥有128K tokens上下文窗口，可满足开发者创建、调试和修改代码需求；

3. Gemini Code Assist还提供GitHub代码审查功能，支持自定义审查样式指南，可检测问题并自动建议修复，注册仅需个人Gmail账户无需信用卡。 https://mp.weixin.qq.com/s/azeOm9m8ph5yg6EOtEb0Ow

四、英伟达下场首次优化DeepSeek-R1！B200性能狂飙25倍

1. 英伟达首次开源基于Blackwell架构优化的DeepSeek-R1-FP4模型，推理速度提升25倍，每token成本降低20倍；

2. 该优化方案使B200实现21,088 token/秒的推理吞吐量，远超H100的844 token/秒，同时在MMLU测试中达到FP8模型性能的99.8%；

3. 英伟达采用FP4量化技术将参数从8位减至4位，降低1.6倍存储和显存需求，已在Hugging Face开源，支持TensorRT-LLM部署。

五、新突破！微软开源多模态AI Agent，通杀数字、物理世界

1. 微软开源多模态AI Agent基础模型Magma，能跨数字和物理世界处理图像、视频、文本等不同类型数据，实现自动操作任务；

2. Magma采用视觉(ConvNeXt)与大语言模型混合架构，支持高分辨率UI操作、物理机器人控制和象棋辅助等复杂场景应用；

3. Magma创新性应用Set-of-Mark(SoM)技术实现行动定位，和Trace-of-Mark(ToM)技术增强心理预测能力，可准确推测视频中物体意图和未来行为。

六、阿里开源频生成模型Wan 2.1，8.2G显存即可生成480P视频

1. 阿里开源Wan 2.1视频模型，14B版本超越Sora，1.3B轻量版仅需8GB显存，4070显卡可运行，Apache 2.0许可免费商用；

2. 模型能生成随物体移动的文字，呈现复杂动作如多人舞蹈、华尔兹旋转，物理效果自然；

3. 技术采用DiT架构和创新3D变分自动编码器，实现特征缓存和高效时空压缩，未来将支持ComfyUI集成。

七、何恺明新作，逐像素建模高分辨率图像，效率提升4000倍

1. 何恺明团队提出分形生成模型，通过递归调用生成模型内部构建自相似架构，在高分辨率图像逐像素生成任务中效率提升4000倍；

2. 分形生成模型采用"分而治之"策略，将联合分布划分为子集，使用递归级别自回归模型高效处理变量分布，降低计算成本；

3. 该模型在ImageNet数据集测试中表现出色，能生成高保真细节图像，并在图像修复、去除修复等编辑任务中有效预测像素。

八、医疗AI助手OpenEvidence获7500万美元，估值10亿美元

1. 医疗AI公司OpenEvidence获红杉资本7500万美元投资，估值达10亿美元。

2. 其医生专用AI助手，仅使用同行评审医学期刊数据训练，不连接互联网，已获《新英格兰医学杂志》授权，目前约四分之一美国医生在使用。

3. 公司采用免费提供服务、广告盈利的商业模式，着眼于缓解医生职业倦怠和预计到2030年美国10万医生短缺问题。