专栏名称: 上海经信委
发布产业发展和信息化建设相关信息,提供办事指南、政策服务信息、产业技术前沿。回复粉丝的提问,提供全市加油站、文化创意地图、i-Shanghai地图等服务功能。
目录
相关文章推荐
青岛日报  ·  盒马,又“摊上事儿”了!这次是…… ·  10 小时前  
青岛日报  ·  盒马,又“摊上事儿”了!这次是…… ·  10 小时前  
财联社AI daily  ·  人工智能爆发激活网络安全市场 | 调研 ·  19 小时前  
财联社AI daily  ·  人工智能爆发激活网络安全市场 | 调研 ·  19 小时前  
沈阳网  ·  刚刚,大连市卫健委辟谣! ·  21 小时前  
文昌公安  ·  @所有家长:电话手表这个功能一定要注意 ·  21 小时前  
文昌公安  ·  @所有家长:电话手表这个功能一定要注意 ·  21 小时前  
网信上海  ·  促进数字消费需要“软硬兼施” ·  2 天前  
51好读  ›  专栏  ›  上海经信委

连续三月登顶全球AI视频榜,上海这家大模型初创公司凭什么?|上海新“模”样

上海经信委  · 公众号  · 互联网安全 科技自媒体  · 2025-03-13 13:34

主要观点总结

文章介绍了上海大模型创业公司MiniMax及其旗下的“海螺AI”和最新自研S2V-01视频模型。MiniMax在视频生成领域取得了显著成就,成为全球AI产品榜的焦点。文章还提到了MiniMax在开源领域的突破,包括推出国内首个基于MoE架构的模型和视觉多模态大模型MiniMax-VL-01等。MiniMax拥有年轻的研发团队,注重技术驱动,以打造科学研发组织体系来应对大模型领域的竞争。

关键观点总结

关键观点1: MiniMax的“海螺AI”成为业界焦点,广受市场好评,并连续蝉联全球AI产品榜榜首。

MiniMax是一家致力于与用户共创智能的通用人工智能科技公司。其推出的“海螺AI”产品在市场上取得了巨大成功,并受到了全球AI爱好者的高度关注。

关键观点2: MiniMax解决了视频生成中的难题,实现了跨视频片段的主体一致性。

用户只需提供一张人物的正面照片,就能生成多段风格迥异的视频,且主角始终是该人物。这得益于MiniMax的最新自研S2V-01视频模型。

关键观点3: MiniMax在开源领域取得突破,推出基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。

这两款模型在多个核心任务中表现优异,尤其是MiniMax-Text-01在长文本处理上带来了惊喜。此外,MiniMax还在架构上做出了大胆创新,以大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈。

关键观点4: MiniMax注重技术驱动和年轻研发团队的建设。

公司大部分成员年龄在35岁以下,许多博士在读书阶段就加入公司作为实习生。MiniMax重视技术变革,鼓励研发人员对技术抱有极致热情,并保持专注。


正文


转载自:上观新闻




说起视频生成模型,如果还只知道Sora,那你显然已经OUT了。

申城大模型创业公司MiniMax(稀宇科技),旗下“海螺AI”一经推出便成为业界焦点,广受市场好评。不知不觉间,“霸榜”2024年12月和2025年1月的全球AI产品榜“出海总榜”和“视频生成”类。近日揭晓的2月榜单,“海螺AI”不出意外地继续蝉联这两项榜首。

眼下,国内大模型创业领域有“六小强”之说,MiniMax亦位列其中。这家创立于2021年的科技公司,正不断“挖深”自己的“护城河”,在激烈竞争中杀出重围。现在,“海螺AI”已成为海外逾200个国家和地区AI爱好者口中的热词,也被视为代表中国先进AI水平的代名词。

MiniMax是通用人工智能科技公司,致力于与用户共创智能。

一张照片就能“拍”电影

Sora的横空出世,点亮了视频生成的赛道。然而,和所有新技术一样,视频生成一旦进入生产环境,要想实现行业应用,各种问题便暴露出来。其中,最头疼的就是,要让视频真正承担起叙事任务,就必须把人物一致性的门槛打下来。

很多人都有这样的体验:上一段视频生成的是小A,下一段视频就变成了另一张脸。无论怎么调整,两段视频的主角都无法统一为一个人。

MiniMax最新自研S2V-01视频模型

直到今年1月,MiniMax发布最新模型,将这一难题彻底化解。用户只需提供一张人物的正面照片,不论生成多少段风格迥异的视频,主角都是这个人。人们惊呼,给一张照片,还一部大片,这不是梦!

在发展过程中,MiniMax始终坚持技术驱动。如何在动态视频中保持人物面部多角度的真实度和稳定性,如何在使用连续片段拼接创作时,使人物角色保持高度一致……这些困扰业界的难题,便成为MiniMax“啃硬骨头”的选择。

研发团队进行了大量技术探索,比选不同的技术路径,最后开发出S2V-01视频模型——只需不到传统方案1%的计算成本和很短的等待时间,就带来了足够好的体验。

值得称赞的是,“海螺AI”在艺术审美上也很“在线”,它能用专业级调光与构图营造美学氛围,精细控制光影效果与景别变化,画面质感媲美大片。

可以说,有了MiniMax的突破,跨视频片段的主体一致性创作痛点成为历史。用户在进行更完整内容表达的视频创作时,也能将更多精力放在内容表达上。

开源“首秀”就抛“王炸”

跨过了“百模大战”的“乱斗”阶段,大模型要“活下来”并走得更远,还有很多技术难关需要攻克:错误率持续降低,无限长的输入和输出,多模态能力……

曾经,在AGI(通用人工智能)这件事上,OpenAI一度是风向标。当全球都在希冀OpenAI尽快给出答案,哪怕是解题思路时,MiniMax已然暗下决心——在算力和数据资源都不占优的条件下,走出一条自己的优化大模型之路。

从2023年夏天开始,公司将80%的算力与研发资源投入底层架构研发,这在外人看来无异于一场豪赌。幸运的是,MiniMax赢了!在成功推出国内首个基于MoE架构的模型后,研发团队又把目光投向了能够几倍提升模型速度的技术难关——线性注意力。

在大部分学术集上,MiniMax都取得了比肩海外第一梯队的结果。







请到「今天看啥」查看全文