2
月
15
日,
OpenAI
发布
Sora
模型,作为
OpenAI
首款文生视频模型,
Sora
展示出许多亮点:首先,是视频生成长度可达
1
分钟,远超其他文生视频模型。作为对比,目前视频生成领域热门的
runway gen2
模型最长可生成
18
秒的视频,
pika 1.0
最长可生成
15
秒的视频。此外,
3D
空间的一致性。
Sora
可以生成具有动态镜头运动的视频,随着摄像机的移动和旋转,人物和场景元素在三维空间中保持连贯的运动。
图片来源于:网络
据
OpenAI
官方文档,
Sora
是一种扩散模型,它从看起来像静态噪声的视频开始生成视频,然后通过多个步骤消除噪声来逐渐转换视频。与
GPT
模型类似,
Sora
使用
transformer
架构,释放出卓越的扩展性能。
OpenAI
将视频和图像表示为称为
Patch
的较小数据单元的集合,每个
Patch
都类似于
GPT
中的一个
token
。通过统一表示数据的方式,可以在比以前更广泛的视觉数据上训练
diffusion transformer
,跨越不同的持续时间、分辨率和纵横比。
图片来源于:
OpenAI
官网
从实用性来看,
Sora
只是展示了几十个精选作品,离落地还有相当的距离。而
OpenAI
的大语言模型大本营正在被对手偷塔
谷歌(
GOOG.US
)
突破的
100
万
tokens
大招,能够给长文本问答
.
视频理解带来惊人的效率飞升,
OpenAI
必须尽快做出回击。不过整体来说,视频长度增加,有望大规模应用在短视频领域,且其扩展视频的能力也有望应用于长视频制作,或将带来新一轮内容创作产业革命。
图片来源于:谷歌
那么在
A
股市场上也往往会引发一轮题材概念炒作。那么
Sora
的出现可能对那些方向带来炒作动力呢
?
首先是算力端。
Sora
依旧符合
AI
缩尺律
OpenAI
在技术文档中说明,随着训练计算量的增加,样本质量明显提高,进一步佐证了多模态时代,算力需求将成为最核心的瓶颈之一。
图片来源于:网络
A
股算力产业链包含
AI
服务器零部件、服务器整机、算力租赁、数据中心等环节。
AI
服务器零部件公司主要包括:海光信息、寒武纪、龙芯中科、景嘉微等
;
服务器整机公司主要包括高新发展、神州数码、拓维信息、广电运通、烽火通信、同方股份等,算力租赁公司主要包括恒润股份、云赛智联、鸿博股份等
;
数据中心公司主要包括奥飞数据、光环新网、宝信软件、数据港等。
图片来源于:财联社
其次是视频生成方向。比如:昆仑万维旗下
Star Group
和
Opera
都具备做短视频的土壤,其中
Opera
在海外已经推出了短视频功能
;
当虹科技拥有自研的
AIGC
工具集,于去年上半年发布以静态照片生成三维体积视频的方案。除此以外还有:万兴科技、博汇科技、易点天下、数码视讯、汉王科技、当虹科技、东方国信、神思电子、因赛集团、拓尔思、国脉文化、佳都科技在内的超
10
家
A
股上市公司近个月以来在互动平台披露视频生成模型领域的业务情况
图片来源于:网络
此外,数据要素方向也需要特别的关注。比如三大运营商:中国电信、中国移动、中国联通。此外还有数据可视化:浩瀚深度、恒为科技、中新赛克
图片来源于:网络
微软(
MSFT.US
)
OpenAI
发布了
Sora
大模型,可根据用户指令生成
1
分钟的高清视频,能生成具有多个角色、包含特定运动的复杂场景,即能够理解和模拟运动中的物理世界。
OpenAI
已经邀请了一支专业的创意人士测试,用于反馈其在专业环境中的实用性。
谷歌(
GOOG.US
)
Google
宣布推出全新的
Gemini 1.5
AI
模型,采用
MOE
架构,可以处理
128000
个
token
的标准情境窗口。
英伟达(
NVDA.US
)
NVIDIA
宣布成立新部门,专注为云计算等公司设计定制芯片。新的
NVIDIA
部门将由
Dina McKinney
领导。
McKinney
曾担任负责
AMD CPU
设计和
Marvell
基础设施处理器的副总裁,他将负责监督为云计算、
5G
电信、游戏、汽车等领域构建定制芯片的团队。
信雅达(
600571
):虽然公司没有
AI
视频业务,但这波
AI
视频的热度要靠信雅达来维持。信雅达表示,
Pika
开发团队创始人之一郭文景系公司实际控制人郭华强先生女儿。除上述关系外,公司与
Pika
无其他关系。(应用)
万兴科技
(
300 624
):万兴科技很早布局
AI
视频领域,万兴发布的
“
天幕
”
大模型,是国内首个专注于以视频创意应用为核心的多媒体大模型,只需输入故事概要,就可以通过大模型能力实现全新视频内容的完整生成。近期,万兴科技
AI
视频创作软件
Filmora13
在东京举办发布会。
果麦文化
(
301052
):
11
月,公司介绍,公司布局的
AI
漫画大模型进展顺利,未来将陆续推出动画电影、短剧、互动漫画等。
网达软件
:根据公司半年报的内容,公司持续加大在融合媒体智能化生产及视频
AI
行业应用领域的研发投入,研发费用较去年同期上升。(应用)
因赛集团
(
300781
):
8
月接受调研时表示,目前公司国风虚拟人
“
姜小黄
”
已接入
AI
大模型实现了超写实化,正在接入和并用多个
AI
模型测试虚拟人视频生成功能。(应用)
捷成股份
(
300182
):根据公司半年报内容,公司结合
AI
技术的发展及在智能媒体资产管理系统的布局,加大在
AIGC
领域的技术开发和应用力度,推动
AIGC
相关技术在内容创意、影视剧内容制作、短视频创作等领域的深度应用。(应用)
昆仑万维
(
300418
):公司正式发布
“
天工
SkyAgents”
平台,用户在上面可以创建自己的大模型。公司
“All in”
人工智能,
4
月发布自研大语言模型
“
天工
”
,近期转让子公司股权,更好的聚焦于
AGI
和
AIGC
业务。目前,昆仑天工已形成
AI
大模型、
AI
搜索、
AI
游戏、
AI
音乐、
AI
动漫、
AI
社交六大
AI
业务矩阵。(应用)
易点天下
(
301171
):
8
月在接受调研时表示,还有内测中的
AI
电商视频广告工具,目前内部已经可以实现
10
倍的广告素材生产效率。(应用)
蓝色光标
(
300058
):
8
月,蓝色光标全资子公司蓝色宇宙发布一款在线
AI
视频生产平台
——
蓝标分身,可以降低了音视频制作的难度。
焦点科技
(
002315
):
5
月份接受调研时表示,公司将持续迭代
AI
麦可,并计划在未来的版本中增加视频处理、
AI
数字营销和
24
小时
AI
客服等相关功能。(应用)
美亚柏科(
300188
):公司发布的
AI-3300“
慧眼
”
视频图像鉴真工作站,可对生成式人工智能产生内容进行检测识别和鉴定。(检测)