专栏名称: 财联社AI daily
财联社及科创板日报旗下产品 ,聚焦TMT领域,更独家、更深度。
目录
相关文章推荐
起点锂电  ·  新能安/多氟多/蓝京/中比/东磁/比克/锂威 ... ·  2 天前  
起点锂电  ·  新能安/多氟多/蓝京/中比/东磁/比克/锂威 ... ·  2 天前  
成都日报  ·  中航成飞正式登陆资本市场 ·  2 天前  
成都日报  ·  中航成飞正式登陆资本市场 ·  2 天前  
51好读  ›  专栏  ›  财联社AI daily

阶跃星辰首次开源Step系列多模态大模型

财联社AI daily  · 公众号  · 科技创业  · 2025-02-18 09:58

主要观点总结

阶跃星辰和吉利汽车集团联合宣布开源两款合作的多模态大模型:阶跃Step-Video-T2V和阶跃Step-Audio。其中,Step-Video-T2V是全球参数量最大、性能最好的开源视频生成模型;Step-Audio则是行业内首款产品级开源语音交互大模型,具备多种语音特征表达功能,用户可以在跃问APP内体验。

关键观点总结

关键观点1: 阶跃星辰和吉利汽车集团合作开源两款多模态大模型

这两大模型是阶跃Step系列的一部分,被宣布为全球范围内开源。

关键观点2: 阶跃Step-Video-T2V模型的特点和性能

这是全球参数量最大、性能最好的开源视频生成模型。参数量达到300亿,可直接生成高质量的视频。

关键观点3: 阶跃Step-Audio模型的特点和功能

作为行业内首款产品级开源语音交互大模型,它能够生成情绪、方言、语种、歌声和个性化风格的表达。模型生成的语音具有超自然、高情商等特征,并能实现高质量的音色复刻。

关键观点4: 用户体验

用户即日起可在跃问APP内体验这些新功能。


正文

阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款Step系列多模态大模型向全球开发者开源。

其中,包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃Step-Audio。

阶跃Step-Video-T2V模型的参数量达到 300 亿,可以直接生成204帧、540P分辨率的高质量视频。 阶跃Step-Audio是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话。模型生成的语音具有超自然、高情商等特征,同时也能实现高质量的音色复刻。用户即日起可在跃问APP内体验新功能。







请到「今天看啥」查看全文


推荐文章
成都日报  ·  中航成飞正式登陆资本市场
2 天前
成都日报  ·  中航成飞正式登陆资本市场
2 天前
互联网深圳说  ·  两岸关系停滞殃及半导体产业
8 年前
销售与市场  ·  Siri:凭啥成功创造了千亿市场
7 年前