专栏名称: AIbase基地

AI日报：阿里新夸克升级为“AI超级框”；谷歌开源多模态模型Gemma-3；潞晨科技开源视频大模型Open-Sora 2.0

AIbase基地 · 公众号 · AI 科技自媒体 · 2025-03-13 16:21

主要观点总结

本文报道了关于AI技术的多个重要新闻，包括阿里巴巴推出AI旗舰应用、谷歌开源新一代多模态模型、百度文心快码推出Comate Zulu版本等。这些新闻涉及AI的多个领域，包括自然语言处理、计算机视觉、编程辅助等。

关键观点总结

关键观点1: 阿里巴巴推出AI旗舰应用“新夸克”，提供一站式服务

阿里巴巴于3月13日推出了其全新升级的AI旗舰应用——新夸克，该应用整合了AI对话、深度思考、深度搜索等多种功能，旨在为用户提供无缝的智能体验。

关键观点2: 谷歌开源新一代多模态模型Gemma-3，性能卓越、成本降低

谷歌最新发布的多模态大模型Gemma-3以其低成本和高性能引起了广泛关注。该模型支持多种参数规模，最大可达270亿参数，且算力需求显著降低。

关键观点3: 百度文心快码推出Comate Zulu版本，助力开发者高效编程

百度旗下的文心快码推出了Comate Zulu版本，通过结合文心大模型的强大能力和丰富的编程大数据，为开发者提供了更高效的编程体验。

关键观点4: 字节Trae接入硅基流动SiliconCloud，支持DeepSeek多款模型API

硅基流动平台与字节跳动推出的AI IDE——Trae正式接入，提升了开发者的编程体验。用户可以通过简单的步骤接入多款编码模型，包括DeepSeek-R1、V3等。

关键观点5: 谷歌AI Studio再进化，支持YouTube视频秒懂，AI作画保持角色统一

谷歌AI Studio的最新升级引发了科技圈的轰动，用户现在可以直接通过YouTube链接理解视频内容。此外，Gemini2.0Flash Experimental模型在图像生成方面展现了惊人的一致性。

关键观点6: 潞晨科技开源视频大模型Open-Sora 2.0，降低训练成本

潞晨科技推出的Open-Sora 2.0以其仅20万美元的训练成本和110亿参数的强大性能，挑战了OpenAI Sora等行业标杆。

关键观点7: 阿里通义新视频生成和编辑模型VACE，实现按条件生成视频

VACE的按条件生成视频功能让用户可以通过文字描述快速实现创意。此外，VACE还具备物体运动轨迹控制、视频主体替换等多种编辑功能。

关键观点8: 理想汽车AI助手理想同学网页版上线，接入DeepSeek R1满血版

理想汽车正式推出其人工智能助手理想同学网页版，接入DeepSeek R1V3671B满血版，提供强大的问答能力和跨场景服务协同。

关键观点9: 谷歌Gemini 2.0 Flash推出原生多模态图像生成功能

谷歌最新推出的Gemini 2.0 Flash在AI图像生成领域引入了原生图像生成技术，显著提升了生成效率和准确性。

关键观点10: Remade AI 开源 8 款 Wan2.1 特效 LoRA，掀起 AI 视频创作热潮

Remade AI 在 Hugging Face 平台推出了基于 Wan2.1 模型的开源特效 LoRA，为 AI 视频生成带来了新的创意可能性。

正文

AI日报

3月13日•AIbase

1、阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

2、谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

3、百度文心快码推出Comate Zulu版本并正式开放公测

4、字节Trae接入硅基流动SiliconCloud 支持DeepSeek多款模型API

5、王炸更新！谷歌AI Studio再进化：YouTube视频秒懂，AI作画还能保持角色统一

6、叫板Sora？潞晨科技开源视频大模型Open-Sora 2.0，降本提速

7、阿里通义新视频生成和编辑模型VACE 可控制运动轨迹、替换主体等

8、理想汽车AI助手理想同学网页版上线：接入DeepSeek R1满血版

9、谷歌Gemini 2.0 Flash放出原生多模态图像生成功能：支持多轮对话式实时编辑

10、Remade AI 开源 8 款 Wan2.1 特效 LoRA，掀起 AI 视频创作新热潮

11、AI对口型革命性突破:Captions新模型Mirage打造超真实UGC视频

12、谷歌推机器人控制模型Gemini Robotics，让机器人像人类一样思考行动

13、智谱AI宣布再获珠海 5 亿元融资

1. 阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

阿里巴巴于3月13日推出了其全新升级的AI旗舰应用——新夸克。这款应用基于阿里通义的先进推理与多模态大模型，整合了多种AI功能，旨在为用户提供无缝的智能体验。新夸克不仅能够进行智能对话，还具备深度思考和执行能力，能够满足用户在多个场景下的需求。

亮点提要：

🤖 新夸克整合了AI对话、深度思考、深度搜索等多种功能，提供一站式服务。

📊 通过智能中枢系统，新夸克能够自动识别用户指令并进行深度执行。

🌐 阿里巴巴计划将通义系列模型的最新成果快速接入新夸克，以增强其功能。

2. 谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

谷歌最新发布的多模态大模型Gemma-3以其低成本和高性能引起了广泛关注。该模型支持多种参数规模，最大可达270亿参数，且仅需一张H100显卡进行高效推理，算力需求显著降低。Gemma-3在对话模型评比中表现优异，支持长文本处理和多模态数据，展现出强大的语言处理能力和创新的架构设计，是当前算力要求最低的高性能模型之一。

亮点提要：

🔍 Gemma-3是谷歌最新开源的多模态大模型，参数范围从10亿到270亿，且算力需求降低10倍。

💡 模型采用创新的架构设计，有效处理长上下文和多模态数据，支持文本与图像的同时处理。

🌐 Gemma-3支持140种语言的处理能力，经过训练优化后在多项任务中表现优异，展现了强大的综合能力。

详情入口：

🔗 https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d

3. 百度文心快码推出Comate Zulu版本并正式开放公测

百度旗下的文心快码推出了Comate Zulu版本，标志着在智能编程领域的一次重大突破。该版本通过结合文心大模型的强大能力和丰富的编程大数据，为开发者提供了更高效的编程体验。用户可以通过自然语言与系统进行交流，快速搭建项目和理解代码逻辑，大幅提升开发效率。

亮点提要：

🛠️ 通过全自然语言实现需求，无需编写代码即可自动搭建项目，支持口语交流和图片展示。

📊 快速理解代码库的业务逻辑，提供架构图梳理和智能启发思路，帮助开发者迅速上手新项目。

⚙️ 自动搭建开发环境，支持依赖自动安装和服务自启动，实现从需求到代码的端到端生成。

详情入口：

🔗 https://comate.baidu.com

4. 字节Trae接入硅基流动SiliconCloud 支持DeepSeek多款模型API

硅基流动平台与字节跳动推出的AI IDE——Trae正式接入，提升了开发者的编程体验。用户可以通过简单的步骤接入多款编码模型，包括DeepSeek-R1、V3等，满足不同需求。平台还提供免费的API服务，助力开发者实现更高效的开发过程。未来，硅基流动将继续扩展模型种类和合作应用，致力于为开发者提供更稳定的服务。

亮点提要：

🔧 Trae接入硅基流动，提供多种高效编码模型，提升编程体验。

🔑 用户可通过简单步骤添加模型，获取API密钥。

🚀 硅基流动致力于提供稳定的API服务，未来将扩展模型种类。

5. 王炸更新！谷歌AI Studio再进化：YouTube视频秒懂，AI作画还能保持角色统一

谷歌AI Studio的最新升级引发了科技圈的轰动，用户现在可以直接通过YouTube链接理解视频内容，无需下载和上传。Gemini2.0Flash Experimental模型不仅在视频解析上表现出色，还在图像生成方面展现了惊人的一致性。

亮点提要：

🎥 谷歌AI Studio现在支持直接解析YouTube视频链接，用户可快速理解视频内容。

🖼️ Gemini2.0Flash exp在图像生成方面表现卓越，角色在多张图片中保持一致性。

⚡ 更新标志着谷歌AI Studio从基础模型向应用级工具的转型，影响现有AI工具生态。

详情入口：

🔗 https://ai.google.dev/gemini-api/docs/vision?lang=python&hl=zh-cn#youtube

6. 叫板Sora？潞晨科技开源视频大模型Open-Sora 2.0，降本提速

潞晨科技推出的Open-Sora2.0以其仅20万美元的训练成本和110亿参数的强大性能，成功挑战了OpenAI Sora等行业标杆。该模型在多个评测中表现优异，尤其在VBench中与OpenAI Sora的性能差距缩小至0.69%。

亮点提要：

💰 成本低：Open-Sora2.0仅需20万美元训练成本，显著低于行业标准。

📈 性能强：拥有110亿参数，性能接近OpenAI Sora，VBench评测中表现优异。

🌐 开源共享：全流程训练代码开源，推动视频生成技术的共同发展。

详情入口：

AI日报：阿里新夸克升级为“AI超级框”；谷歌开源多模态模型Gemma-3；潞晨科技开源视频大模型Open-Sora 2.0

主要观点总结

关键观点总结

关键观点1: 阿里巴巴推出AI旗舰应用“新夸克”，提供一站式服务

关键观点2: 谷歌开源新一代多模态模型Gemma-3，性能卓越、成本降低

关键观点3: 百度文心快码推出Comate Zulu版本，助力开发者高效编程

关键观点4: 字节Trae接入硅基流动SiliconCloud，支持DeepSeek多款模型API

关键观点5: 谷歌AI Studio再进化，支持YouTube视频秒懂，AI作画保持角色统一

关键观点6: 潞晨科技开源视频大模型Open-Sora 2.0，降低训练成本

关键观点7: 阿里通义新视频生成和编辑模型VACE，实现按条件生成视频

关键观点8: 理想汽车AI助手理想同学网页版上线，接入DeepSeek R1满血版

关键观点9: 谷歌Gemini 2.0 Flash推出原生多模态图像生成功能

关键观点10: Remade AI 开源 8 款 Wan2.1 特效 LoRA，掀起 AI 视频创作热潮

正文

请到「今天看啥」查看全文