专栏名称: 橘子汽水铺
橘子汽水铺 by orange.ai。 AI创始人, AI投资人,AI产品经理都在关注的AI科技自媒体。 聚焦最有商业价值的AI资讯,分享一线的AI产品经理经验。
目录
相关文章推荐
哎咆科技  ·  iPhone SE 4 最快明天发布?直接上架! ·  昨天  
EETOP  ·  远高预期,台积电拟大幅涨价! ·  2 天前  
哎咆科技  ·  苹果憋大招!iOS 18.4 Siri ... ·  3 天前  
ZOL中关村在线  ·  你的第一部手机是iPhone还是安卓? ·  3 天前  
51好读  ›  专栏  ›  橘子汽水铺

腾讯AI全面拥抱开源,389B参数MoE,最强开源模型来了

橘子汽水铺  · 公众号  ·  · 2024-11-06 07:52

正文

腾讯这次真的是把家底儿都掏出来了…

把自家最好的大模型之一混元 Large 开源了。

这就是元宝 AI 阅读、AI 搜索等腾讯自己产品里都在用的同款模型。

同时也是目前综合能力最强的开源MoE大语言模型。

模型特点:

  • 389B 的 MoE 模型,激活参数 52B,256K 上下文,7T 训练量

  • 免费,可商用

  • 各项指标都非常好

  • 代码能力非常强


腾讯 Large 和一些开源模型的指标对比,在技术报告中有更详尽的对比:

干货满满的技术报告:

腾讯不仅放出了自家的超强模型,还公开了干货满满的技术报告。

这个技术报告满足了我对很多前沿技术的好奇心,比如:

  • MoE 的 Scaling Law 有何特别之处

  • MoE 如何有效激活和训练每个专家的能力

  • 合成数据的应用,如何对代码和数学能力提升超 10%

对开发 AI 应用和研究大语言模型技术都很有帮助, 强烈建议收藏学习!

技术报告地址:

https://arxiv.org/abs/2411.02265

去哪里用腾讯混元 Large:

官网体验地址:

https://llm.hunyuan.tencent.com/

Github地址:

https://github.com/Tencent/Tencent-Hunyuan-Large

Hugging Face 地址:

https://huggingface.co/tencent/Tencent-Hunyuan-Large

全面拥抱开源的腾讯

官方的发布会上,腾讯说,这次的开源,其实只是第一步。

接下来,还会有混元-M和混元-S会陆续开源。

毕竟389B参数的混元 Large,在很多场景里,有点大材小用。

这些场景使用小模型更具性价比。


值得一提的是,今天除了混元 Large 之外,腾讯还放出了一个 3D 模型:混元 3D 1.0

这是业界首个同时支持文字、图像生成3D的开源大模型。

有了 3D 模型和拓竹 3D 打印机,未来轻松实现玩具自由…

上传一张照片——生成 3D 模型——3D 打印出来







请到「今天看啥」查看全文