专栏名称: 云头条
引领科技变革,连接技术与商业
目录
相关文章推荐
Linux就该这么学  ·  不止是操作系统!Linux ... ·  昨天  
Linux就该这么学  ·  微信新功能升级:可一次性删除所有“单向好友” ·  3 天前  
Linux爱好者  ·  AI 正在培养一代 “文盲程序员” ·  6 天前  
Linux爱好者  ·  126K + 30K ... ·  6 天前  
Linux爱好者  ·  嵌入式开发实战:国产8nm AIoT全流程 ·  4 天前  
51好读  ›  专栏  ›  云头条

腾讯混元文生图:第一

云头条  · 公众号  ·  · 2024-12-24 23:34

正文

近日,智源研究院发布最新的 FlagEval‌ 大模型评测排行榜。
结果显示,在多模态模型评测榜单的文生 模型中,腾讯混元的文生图能力位居榜首。随后分别为字节跳动的豆包模型,以及国外 Ideogram 研发的文本生成图像模型 Ideogram 2.0
‌FlagEval‌ 是由北京智源人工智能研究院(BAAI)推出的大模型评测体系及开放平台,用于评估基础模型及训练算法的性能,评测范围涉及国内外100余个开源和商业闭源模型,覆盖大语言模型,视觉语言、文生图、文生视频、语音语言等多模态模型等领域。

据介绍,该文生图评测采用主观评测作为排名依据,客观评测数据仅供参考。主观评测从图文一致性、图片质量、美学质量和安全性四个维度进行人工打分,在最终主观排名里,这四个维度的权重分别 5:2:2:1,以此分数作为最终主观排名分数。每张图片每个维度的得分由三个标注人员打分取平均得出。

腾讯混元的文生图能力目前全面对外开放,普通用户可通过腾讯AI助手应用腾讯元宝免费使用,企业用户和开发者可以通过腾讯云 API 调用该能力。

此外,今年 5 月,混元文生图大模型也宣布升级并开源,已在 Hugging Face 平台及 Github 上发布,项目目前 Github Stars 已经达到 3.7 K。腾讯混元文生图(HunyuanDiT)采用了与 sora 一致的 DiT 架构, 是业内首个中文原生的 DiT 架构文生图开源模型,支持中英文双语输入及理解。
腾讯混元文生图能力,已广泛被用于素材创作、商品合成、游戏出图等多项业务场景中。
基于腾讯混元的 AI 广告创意平台腾讯广告妙思,可为广告主提供文生图、图生图、商品背景合成等多场景创意工具,有效提高广告生产及投放效率。
《央视新闻》《新华日报》《深圳特区报》《南方都市报》《羊城晚报》等20余家媒体,也已经将腾讯混元文生图用于新闻内容生产。







请到「今天看啥」查看全文