生成式AI
一、 DeepSeek Day 3:DeepGEMM 300行代码优化内核超专家
1. DeepSeek开源DeepGEMM库,仅300行代码超越专家优化内核,支持稠密和MoE模型,在Hopper GPU上实现高达1350+ FP8 TFLOPS算力;
2. DeepGEMM采用完全即时编译设计、细粒度缩放技术和多项创新优化方法,在多种矩阵形状下性能提升显著;
3. DeepSeek-R2或提前5月前发布,将实现更好的编码能力,并支持英语外的多语言推理。
https://mp.weixin.qq.com/s/4aKxWIpb2-9DZKrSSAYoWg
二、 OpenAI Deep Research已向所有付费用户开放,系统卡发布
1. OpenAI向所有付费用户(刚发布时仅 Pro 用户可用)开放Deep Research功能,该智能体基于o3正式版模型,能综合互联网信息完成复杂研究任务;
2. OpenAI发布Deep Research系统卡,详述其训练数据、安全测试和风险评估,首次将模型在网络安全风险评级为"中等风险";
3. Deep Research通过外部红队评估和准备度框架评估,能执行网页浏览、数据分析、Python代码等多步骤任务,在SWE-Lancer测试中表现优异。
https://mp.weixin.qq.com/s/re7T8mzRFlG_D0gM0tNKOg
三、 谷歌推出免费Gemini 2.0代码助手,每月18万次代码补全
1. 谷歌宣布全球推出免费版Gemini Code Assist编程助手,提供每月180,000次代码补全,远超其他免费工具的2,000次限制;
2. 该工具基于Gemini 2.0大模型,支持所有公共领域编程语言,拥有128K tokens上下文窗口,可满足开发者创建、调试和修改代码需求;
3. Gemini Code Assist还提供GitHub代码审查功能,支持自定义审查样式指南,可检测问题并自动建议修复,注册仅需个人Gmail账户无需信用卡。
https://mp.weixin.qq.com/s/azeOm9m8ph5yg6EOtEb0Ow
四、 英伟达下场首次优化DeepSeek-R1!B200性能狂飙25倍
1. 英伟达首次开源基于Blackwell架构优化的DeepSeek-R1-FP4模型,推理速度提升25倍,每token成本降低20倍;
2. 该优化方案使B200实现21,088 token/秒的推理吞吐量,远超H100的844 token/秒,同时在MMLU测试中达到FP8模型性能的99.8%;
3. 英伟达采用FP4量化技术将参数从8位减至4位,降低1.6倍存储和显存需求,已在Hugging Face开源,支持TensorRT-LLM部署。
https://mp.weixin.qq.com/s/FC8ZX4SeFteQQbJ8cZZi4w
五、 新突破!微软开源多模态AI Agent,通杀数字、物理世界
1. 微软开源多模态AI Agent基础模型Magma,能跨数字和物理世界处理图像、视频、文本等不同类型数据,实现自动操作任务;
2. Magma采用视觉(ConvNeXt)与大语言模型混合架构,支持高分辨率UI操作、物理机器人控制和象棋辅助等复杂场景应用;
3. Magma创新性应用Set-of-Mark(SoM)技术实现行动定位,和Trace-of-Mark(ToM)技术增强心理预测能力,可准确推测视频中物体意图和未来行为。
https://mp.weixin.qq.com/s/jlVAkaho7DOHaDMSFUsnFA
六、 阿里开源频生成模型Wan 2.1,8.2G显存即可生成480P视频
1. 阿里开源Wan 2.1视频模型,14B版本超越Sora,1.3B轻量版仅需8GB显存,4070显卡可运行,Apache 2.0许可免费商用;
2. 模型能生成随物体移动的文字,呈现复杂动作如多人舞蹈、华尔兹旋转,物理效果自然;
3. 技术采用DiT架构和创新3D变分自动编码器,实现特征缓存和高效时空压缩,未来将支持ComfyUI集成。
https://mp.weixin.qq.com/s/-BhVYPkza157KXpL4KG8-Q
七、 何恺明新作,逐像素建模高分辨率图像,效率提升4000倍
1. 何恺明团队提出分形生成模型,通过递归调用生成模型内部构建自相似架构,在高分辨率图像逐像素生成任务中效率提升4000倍;
2. 分形生成模型采用"分而治之"策略,将联合分布划分为子集,使用递归级别自回归模型高效处理变量分布,降低计算成本;
3. 该模型在ImageNet数据集测试中表现出色,能生成高保真细节图像,并在图像修复、去除修复等编辑任务中有效预测像素。
https://mp.weixin.qq.com/s/CCxUtsY4X33mNU71FkzoXg
八、 医疗AI助手OpenEvidence获7500万美元,估值10亿美元
1. 医疗AI公司OpenEvidence获红杉资本7500万美元投资,估值达10亿美元。
2. 其医生专用AI助手,仅使用同行评审医学期刊数据训练,不连接互联网,已获《新英格兰医学杂志》授权,目前约四分之一美国医生在使用。
3. 公司采用免费提供服务、广告盈利的商业模式,着眼于缓解医生职业倦怠和预计到2030年美国10万医生短缺问题。
https://mp.weixin.qq.com/s/ESfggHjvEAuVM1B15FGNtA