腾讯最近在大模型领域
动作频频
继2月底推出新一代
快思考模型混元Turbo S后
3月21日深夜
腾讯宣布推出
自研深度思考模型混元T1正式版
并同步在腾讯云官网上线
腾讯混元T1正式版如期发布。
之所以称之为“如期发布”,是因为前不久腾讯混元自研的快思考模型混元Turbo S正式发布时,腾讯就曾表示,正式版的腾讯混元T1模型API也将很快上线,对外提供接入服务。
据知情人士介绍,腾讯混元T1正式版以混元Turbo S为基座打造,亮点在于其是能够秒回、吐字快、擅长超长文处理的强推理模型,性能保持业界领先。
“混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。”上述知情人士说,这一架构显著降低了训练和推理成本,让混元T1实现首字秒出,吐字速度达到最快80 tokens/s。
混元T1在超长文本推理领域也展现出独特优势,能够有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合Mamba架构针对长序列处理进行了专项优化,提升了解码速度。
通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步提升了推理能力。与此前已上线腾讯元宝的混元T1-preview模型相比,综合效果明显提升。
腾讯方面提供的数据显示,在体现推理模型基础能力的常见Benchmark上,以及在中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。此外,T1还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。
值得一提的是,目前,混元T1已在腾讯云官网上线。定价方面,输入价格为每百万tokens 1元,输出价格为每百万tokens 4元。
今年以来,腾讯混元大模型持续快速迭代,AI似乎已成为腾讯内部最大的驱动力。
其推出了深度思考模型T1 Preview和快思考模型Turbo S,并已广泛应用于腾讯元宝、ima、腾讯文档、微信读书、搜狗输入法、QQ浏览器等多款内部产品。腾讯混元积极拥抱开源,其开源模型全面覆盖文本、图像、视频和3D生成等多个模态。
业内认为,这一战略选择的背后,一方面基于腾讯长期以来坚持技术普惠的理念,另一方面也得益于腾讯在用户与产业多端的场景与生态优势,为AI技术的落地提供了广阔空间。
在日前公布的2024年财报中,腾讯年研发投入707亿元创下纪录。对于业务侧,AI技术对微信新芽业务的提振效应,推动了腾讯营销服务板块的快速增长。其2024年第四季度在AI领域的资本开支超390亿元,2025年将持续加码,AI战略已进入重投入期。
腾讯董事会主席兼首席执行官马化腾表示,“受益于AI赋能的广告平台升级、视频号用户参与度提升以及长青游戏的增长,我们2024年第4季取得双位数的收入增长,并持续提升运营效率。数月前,我们重组了AI团队以聚焦于快速的产品创新及深度的模型研发,增加了AI相关的资本开支,并加大了我们对原生AI产品的研发和营销力度。”他表示。