专栏名称: 上海经信委
发布产业发展和信息化建设相关信息,提供办事指南、政策服务信息、产业技术前沿。回复粉丝的提问,提供全市加油站、文化创意地图、i-Shanghai地图等服务功能。
目录
相关文章推荐
萧山发布  ·  今天!中国金球奖在萧山揭晓! ·  1小时前  
萧山发布  ·  今天!中国金球奖在萧山揭晓! ·  1小时前  
南京零距离  ·  足球小将在西班牙脑死亡,北京足协通报详情! ·  6 小时前  
南京零距离  ·  足球小将在西班牙脑死亡,北京足协通报详情! ·  6 小时前  
文刀老湿  ·  8次出场7粒进球,凯恩火力全开!派尚第3分钟 ... ·  14 小时前  
文刀老湿  ·  8次出场7粒进球,凯恩火力全开!派尚第3分钟 ... ·  14 小时前  
新快报  ·  2025中国足球开门红 ·  昨天  
新快报  ·  2025中国足球开门红 ·  昨天  
51好读  ›  专栏  ›  上海经信委

阶跃星辰语言模型上新:Step-2 mini、 Step-2 文学大师版|产业创新动态

上海经信委  · 公众号  ·  · 2025-01-21 18:46

正文


转载自: 阶跃星辰


继推理模型 Step R-mini之后, 春节前夕 Step 系列模型上新 第二弹 来啦!


10 个月前,阶跃星辰发布了万亿参数语言大模型 Step-2。凭借行业领先的模型性能,Step-2 多次在 LiveBench 等国际权威榜单上位列国产大模型第一。


包括林间疗愈室、歌词爆改机、陌生人闹钟在内,越来越多的开发者,通过 Step-2 打造剧情创作、角色扮演、文案撰写等创作相关的 AI 应用能力。在不同的创作场景下,开发者们对语言模型有着差异化的需求。


因此,近日阶跃星辰推出 Step-2 Family 的两位新成员——极速响应、高性价比的 Step-2 mini ,以及 Step-2 中的“莎士比亚”, Step-2 文学大师 版。


Step-2 mini:极速响应,高性价比


Step-2 mini 是敏捷的轻量级选手。 和万亿参数大模型 Step-2 相比, 3% 左右的 参数量保有了 80%以上的 模型性能


与此同时,Step-2 mini 拥有更快的生成速度和极高的性价比 。在输入 4000 tokens 的情况下,Step-2 mini 的平均首字时延仅 0.17 秒。目前,已经可以在阶跃星辰开放平台调用 Step-2 mini 的 API 接口。输入 1 元/百万 token;输出 2 元/百万 token。


Step-2 mini 采用了阶跃星辰自主研发的 新型注意力机制架构 ——MFA(Multi-matrix Factorization Attention,多矩阵分解注意力)及其变体 MFA-Key-Reuse,相比于常用的 MHA(Multi-Head Attention,多头注意力)架构,节省了近 94% 的 KV 缓存开销,拥有更快的推理速度并大幅降低了推理成本。


Step-2 文学大师版:文思泉涌,妙笔生花


Step-2 文学大师版为创作而生,它沿袭了 Step-2 广袤的知识储备、对文字强大的细节把控能力,与此同时它还拥有更加强大的内容创作能力。同时,Step-2 文学大师版能够充分理解用户的创作需求,逻辑严密、语言凝练、言之有物、节奏紧凑,加强了内容锐度和新意,进一步减少“AI味儿”,增强了真情实感。


Step-2 文学大师版已经上线跃问 App,网页端也将全量上线(https://yuewen.cn)!




欢迎转发,但请注明出处“上海经信委”







请到「今天看啥」查看全文