DeepSeek除夕炸场！发布开源多模态大模型，文生图跑分力压OpenAI DALL-E 3

玩转VSCode · 公众号 · · 2025-01-28 09:23

正文

转自 InfoQ

这个除夕，所有的聚光灯理应给到DeepSeek。

刚刚，人工智能社区Hugging Face显示，DeepSeek刚刚发布了开源多模态人工智能（AI）模型Janus-Pro，这是一款基于 DeepSeek-LLM-1.5b-base 和 DeepSeek-LLM-7b-base 构建的模型。在这系列模型中，Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。

GitHub项目地址：

https://github.com/deepseek-ai/Janus?tab=readme-ov-file

HuggingFace项目地址：

https://huggingface.co/deepseek-ai/Janus-Pro-1B

据悉，Janus-Pro 是一种创新的自回归框架，旨在统一多模态理解与生成任务。它通过将视觉编码解耦为独立的路径，同时仍采用单一的统一 Transformer 架构进行处理，从而解决了以往方法的局限性。这种解耦不仅缓解了视觉编码器在理解与生成任务中的角色冲突，还增强了框架的灵活性。值得一提的是，Janus-Pro 超越了以往的统一模型，还在性能上媲美甚至超越了针对特定任务设计的模型。

请到「今天看啥」查看全文

推荐文章

DeepTech深科技 · 最新拉伸实验表明：硅纳米线的拉伸能力接近其理论极限值

8 年前

可爱多手工艺术 · 没人要的废旧木头搬回家之后，竟然变成了……

8 年前

丁香医生 · 舌苔总是又白又厚，是不是身体出了什么问题？

8 年前

关爱八卦成长协会 · 居然还有这种地方，合法脱衣舞？我要去啊啊啊啊！

8 年前

英伦圈 · 【英伦房】在伦敦闹市享受自然风光，与野生动物做邻居…

8 年前