专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
目录
相关文章推荐
知乎日报  ·  知乎图书新品上新——给 6-12 ... ·  昨天  
九章算法  ·  「九点热评」亚马逊整个org被AI替代! ·  3 天前  
Quora文选英语  ·  Quora_你最近最快乐的时刻是什么时候?【 ... ·  3 天前  
知乎日报  ·  有什么东西是外国人吃,而中国人不吃的? ·  3 天前  
51好读  ›  专栏  ›  歸藏的AI工具箱

真卷啊,通义也没闲着,开源了多模态模型 Qwen2.5 VL#A-20250128110141

歸藏的AI工具箱  · 微博  ·  · 2025-01-28 11:01

正文

2025-01-28 11:01

真卷啊,通义也没闲着,开源了多模态模型 Qwen2.5 VL #AI创造营# #ai#

这次的升级挺大的在多模态上可以跟 Gemini 掰手腕了

- 包含 3B、7B 和 72B 在内的 3 个模型尺寸
- 直接作为一个视觉 Agent,可以推理操作电脑界面
- Qwen2.5-VL 能够理解超过 1 小时的视频
- 支持通过精准定位相关视频片段来捕捉事件的新能力
- 通过精准定位相关视频片段来捕捉事件的新能力
- 对于发票、表单、表格等数据,支持内容的结构化输出

博客:qwenlm.github.io/zh/blog/qwen2.5-vl/






请到「今天看啥」查看全文