港大字节最新视频生成模型刷屏！网友直接RIP市场营销，Sora也不香了

量子位 · 公众号 · AI · 2025-02-10 18:40

正文

鱼羊西风发自凹非寺
量子位 | 公众号 QbitAI

刚刚，港大字节联手发布最新视频生成模型，让歪果网友直呼疯狂。

有人甚至直接RIP市场营销、TikTok用户和YouTube创作者。

你敢信，下面这一幕不是来自欧巴电视剧，而是AI生成的！

造出它的新模型名为 Goku （悟空），是一系列基于 rectified flow Transformer 的模型，专为图像和视频联合生成而设计，支持文生视频、图生视频、文生图。

另外还有 Goku+ ，是视频广告基础模型，官方更是直言“它能以比原来低100倍的成本创建广告视频”。

Goku生成商品广告手拿把掐，无论是展示食物还是化妆品都很逼真自然，人物神情也很难看出破绽：

以下生成的吃播视频更是让人分不出真假：

再拿出一张白底的皮鞋照片，毫不费力就能将其搬到展台上展示：

甚至能仅凭一张商品图+文字prompt，就生成带人物的交互讲解视频。

prompt：

The woman stands behind a colorful Minnie Mouse product, her head gently swaying left and right as she speaks animatedly. Her hands rest on the table, framing the product, while her mouth opens and closes with noticeable emphasis, conveying her enthusiasm and detailed explanation. The camera remains steady, capturing her expressive gestures and the vibrant design of the product in front of her. （女士站在一个色彩缤纷的米妮老鼠产品后面，她的头部轻轻地左右摆动，边说边展现生动的表情。她的手搭在桌子上，框住了产品，同时她的嘴巴张开合上，明显强调着，传达出她的热情和详尽的解释。摄像机保持稳定，捕捉到她富有表现力的手势和她面前产品的鲜艳设计。）