专栏名称: 天风国际
天风国际是天风证券境外全资子公司,立志于成为全球资产配置专家,用我们的专业专注力连接中外,为海内外客户寻找最优质资产和提供最专业的投资咨询。
目录
相关文章推荐
钱江晚报  ·  消息传来!英雄白龙,不幸去世 ·  昨天  
钱江晚报  ·  《甄嬛传》女演员自曝!网友怒了 ·  2 天前  
钱江晚报  ·  大S妈妈首度发文,回应女儿去世 ·  2 天前  
杭州交通918  ·  大涨!还在涨!创历史新高🤯 ·  2 天前  
钱江晚报  ·  岳云鹏,传来喜讯! ·  2 天前  
51好读  ›  专栏  ›  天风国际

大模型专题 | Sora引爆文生视频!市场的关注点在哪?

天风国际  · 公众号  ·  · 2024-02-22 20:01

正文

2 15 日, OpenAI 发布 Sora 模型,作为 OpenAI 首款文生视频模型, Sora 展示出许多亮点:首先,是视频生成长度可达 1 分钟,远超其他文生视频模型。作为对比,目前视频生成领域热门的 runway gen2 模型最长可生成 18 秒的视频, pika 1.0 最长可生成 15 秒的视频。此外, 3D 空间的一致性。 Sora 可以生成具有动态镜头运动的视频,随着摄像机的移动和旋转,人物和场景元素在三维空间中保持连贯的运动。

图片来源于:网络

OpenAI 官方文档, Sora 是一种扩散模型,它从看起来像静态噪声的视频开始生成视频,然后通过多个步骤消除噪声来逐渐转换视频。与 GPT 模型类似, Sora 使用 transformer 架构,释放出卓越的扩展性能。 OpenAI 将视频和图像表示为称为 Patch 的较小数据单元的集合,每个 Patch 都类似于 GPT 中的一个 token 。通过统一表示数据的方式,可以在比以前更广泛的视觉数据上训练 diffusion transformer ,跨越不同的持续时间、分辨率和纵横比。

图片来源于: OpenAI 官网

从实用性来看, Sora 只是展示了几十个精选作品,离落地还有相当的距离。而 OpenAI 的大语言模型大本营正在被对手偷塔 谷歌( GOOG.US 突破的 100 tokens 大招,能够给长文本问答 . 视频理解带来惊人的效率飞升, OpenAI 必须尽快做出回击。不过整体来说,视频长度增加,有望大规模应用在短视频领域,且其扩展视频的能力也有望应用于长视频制作,或将带来新一轮内容创作产业革命。

图片来源于:谷歌

那么在 A 股市场上也往往会引发一轮题材概念炒作。那么 Sora 的出现可能对那些方向带来炒作动力呢 ? 首先是算力端。 Sora 依旧符合 AI 缩尺律 OpenAI 在技术文档中说明,随着训练计算量的增加,样本质量明显提高,进一步佐证了多模态时代,算力需求将成为最核心的瓶颈之一。

图片来源于:网络

A 股算力产业链包含 AI 服务器零部件、服务器整机、算力租赁、数据中心等环节。 AI 服务器零部件公司主要包括:海光信息、寒武纪、龙芯中科、景嘉微等 ; 服务器整机公司主要包括高新发展、神州数码、拓维信息、广电运通、烽火通信、同方股份等,算力租赁公司主要包括恒润股份、云赛智联、鸿博股份等 ; 数据中心公司主要包括奥飞数据、光环新网、宝信软件、数据港等。

图片来源于:财联社

其次是视频生成方向。比如:昆仑万维旗下 Star Group Opera 都具备做短视频的土壤,其中 Opera 在海外已经推出了短视频功能 ; 当虹科技拥有自研的 AIGC 工具集,于去年上半年发布以静态照片生成三维体积视频的方案。除此以外还有:万兴科技、博汇科技、易点天下、数码视讯、汉王科技、当虹科技、东方国信、神思电子、因赛集团、拓尔思、国脉文化、佳都科技在内的超 10 A 股上市公司近个月以来在互动平台披露视频生成模型领域的业务情况

图片来源于:网络

此外,数据要素方向也需要特别的关注。比如三大运营商:中国电信、中国移动、中国联通。此外还有数据可视化:浩瀚深度、恒为科技、中新赛克

图片来源于:网络

微软( MSFT.US OpenAI 发布了 Sora 大模型,可根据用户指令生成 1 分钟的高清视频,能生成具有多个角色、包含特定运动的复杂场景,即能够理解和模拟运动中的物理世界。 OpenAI 已经邀请了一支专业的创意人士测试,用于反馈其在专业环境中的实用性。

谷歌( GOOG.US Google 宣布推出全新的 Gemini 1.5 AI 模型,采用 MOE 架构,可以处理 128000 token 的标准情境窗口。

英伟达( NVDA.US NVIDIA 宣布成立新部门,专注为云计算等公司设计定制芯片。新的 NVIDIA 部门将由 Dina McKinney 领导。 McKinney 曾担任负责 AMD CPU 设计和 Marvell 基础设施处理器的副总裁,他将负责监督为云计算、 5G 电信、游戏、汽车等领域构建定制芯片的团队。

信雅达( 600571 ):虽然公司没有 AI 视频业务,但这波 AI 视频的热度要靠信雅达来维持。信雅达表示, Pika 开发团队创始人之一郭文景系公司实际控制人郭华强先生女儿。除上述关系外,公司与 Pika 无其他关系。(应用)

万兴科技 300 624 ):万兴科技很早布局 AI 视频领域,万兴发布的 天幕 大模型,是国内首个专注于以视频创意应用为核心的多媒体大模型,只需输入故事概要,就可以通过大模型能力实现全新视频内容的完整生成。近期,万兴科技 AI 视频创作软件 Filmora13 在东京举办发布会。

果麦文化 301052 ): 11 月,公司介绍,公司布局的 AI 漫画大模型进展顺利,未来将陆续推出动画电影、短剧、互动漫画等。 网达软件 :根据公司半年报的内容,公司持续加大在融合媒体智能化生产及视频 AI 行业应用领域的研发投入,研发费用较去年同期上升。(应用)

因赛集团 300781 ): 8 月接受调研时表示,目前公司国风虚拟人 姜小黄 已接入 AI 大模型实现了超写实化,正在接入和并用多个 AI 模型测试虚拟人视频生成功能。(应用)

捷成股份 300182 ):根据公司半年报内容,公司结合 AI 技术的发展及在智能媒体资产管理系统的布局,加大在 AIGC 领域的技术开发和应用力度,推动 AIGC 相关技术在内容创意、影视剧内容制作、短视频创作等领域的深度应用。(应用)

昆仑万维 300418 ):公司正式发布 天工 SkyAgents” 平台,用户在上面可以创建自己的大模型。公司 “All in” 人工智能, 4 月发布自研大语言模型 天工 ,近期转让子公司股权,更好的聚焦于 AGI AIGC 业务。目前,昆仑天工已形成 AI 大模型、 AI 搜索、 AI 游戏、 AI 音乐、 AI 动漫、 AI 社交六大 AI 业务矩阵。(应用)

易点天下 301171 ): 8 月在接受调研时表示,还有内测中的 AI 电商视频广告工具,目前内部已经可以实现 10 倍的广告素材生产效率。(应用)

蓝色光标 300058 ): 8 月,蓝色光标全资子公司蓝色宇宙发布一款在线 AI 视频生产平台 —— 蓝标分身,可以降低了音视频制作的难度。

焦点科技 002315 ): 5 月份接受调研时表示,公司将持续迭代 AI 麦可,并计划在未来的版本中增加视频处理、 AI 数字营销和 24 小时 AI 客服等相关功能。(应用)

美亚柏科( 300188 ):公司发布的 AI-3300“ 慧眼 视频图像鉴真工作站,可对生成式人工智能产生内容进行检测识别和鉴定。(检测)

盛天网络






请到「今天看啥」查看全文