专栏名称: AI算法与图像处理
考研逆袭985,非科班跨行AI,目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技,共同分享宝贵的资源资料,这里有机器学习,计算机视觉,Python等技术实战分享,也有考研,转行IT经验交流心得
目录
相关文章推荐
小众软件  ·  另外两件事[250312] ·  昨天  
小众软件  ·  真的很老的古董更新:RBTray ·  昨天  
APPSO  ·  本地部署满血版 DeepSeek ... ·  2 天前  
APPSO  ·  iPhone 将迎来 10 ... ·  2 天前  
南方能源观察  ·  两会声音 | 能源央企“一把手”谈行业发展新思路 ·  2 天前  
51好读  ›  专栏  ›  AI算法与图像处理

别吹Sora了,实测一言难尽。甚至分不清人脸和猪??

AI算法与图像处理  · 公众号  ·  · 2024-12-12 19:18

正文

毫不意外的,Sora今天全网刷屏了。
Altman直接穿着带Sora logo的卫衣

没错,Sora来了,立即可用。

Sora官网:https://sora.com/

先来看看官方划的重点:

  1. 现在的Sora性能更好,支持文生视频、图生视频、视频转视频,最高1080p,最长20秒视频时长。
  2. Storyboard功能:可以把一句prompt扩展成带时间线的剧情,并且可以二次编辑
  3. 其他视频生成小功能,例如两个视频融合的Blend功能、替换视频中的元素的Remix功能、提取视频关键帧并重新延伸视频时长的Re-Cut功能、生成循环视频内容的Loop功能等。

再来看个官方发布的视频:

看着很不错对不对。

在看发布会的时候,笔者就预感到一会儿sora服务器要被挤崩,毕竟这可是积累了一年情绪的期货兑现。

所以笔者干脆去疯狂刷新sora的网页去了,sora一上线,就作为第一批用户成功注册并挤进了服务器!

来, 带你们看下你注册账号完成后的第一屏

你没看错,我当时也懵了,还以为是不是出bug了。

这tm什么产品逻辑,刚一注册,弹窗让我付费?

我情怀呢,连个免费试用都没有吗?想钱想疯了吗。。。

而且20美金,140多人民币,就只能生成50个视频?

合着一个5秒的720p镜头值3块钱?

这得是多大的自信才能这样定价。

看到这儿我反而兴奋了,不用说,OpenAI敢这么自信,说明这波一定是不得了的划时代的东西,没错了。

干!

反手就冲了20美金。

Plus套餐(20美元/月):50个视频(1000个积分);720p分辨率;5秒视频时长。

Pro套餐(200美元/月):500个插队处理的视频(10000个积分);无限次排队处理的视频,分辨率1080p、最长20秒视频时长;最多同时处理5个生成请求;下载无水印。

Sam Altman收到我给他打的20美金后,我成功解锁了看到Sora控制台首页的资格——

确实很OpenAI。

整体上,依然是一个文生视频的框架。

你可以输入关于你的视频创意的描述,输入后,如果点击右下角的发送箭头,就直接给你生成视频了。

如果点击的是发送按键旁边的Storyboard,相当于它会帮你做提示词优化,把你的创意改成带时间轴和详细细节的提示词。稍后我再讲。

这里我先讲下左下角的两个按钮。

一个是文件上传。

你可以上传图片、视频来进行图生视频、视频生视频的操作,这块估计大家在其他AI视频上也都见过了。不过,sora这里上传的素材不能包括人脸,不得不说隐私保护还是到位的。

第二个按钮是关于视频参数的控制。

具体来说,你可以控制的参数包括:

1. 视频的长宽比

包括16:9、1:1和9:16这三挡。

2. 视频的清晰度

20美金的plus会员只能生成480p和720p的视频。

如果你想生成1080p的视频,好家伙,你得花10倍的价格,去开200美金/月的Pro会员。

不是,Sam哥们,你知道在你“憋大招”的这一年里, 像智谱这样的中国大模型厂商早就把AI视频卷到4k分辨率 了吗...

结果1080p你现在跟我要200美金/月??

行,如果能跟国产AI视频厂商,拉开代际的差距,我觉得其实也可以接受。

3. 视频时长

有5秒、10秒、15秒、20秒这四档。

Plus用户只能生成5秒和10秒视频。15秒和20秒同样要开200美金Pro账户才行。

4. 抽卡数量

玩过AI视频的小伙伴都知道,这玩意就跟文生图一样,效果行不行,非常依赖抽卡这个动作(一次性给到的视频候选数量)。

所以抽卡的数量,会对你最终得到满意的视频的进程影响很大,基本就是成倍的时间消耗。

同样的分档——Plus用户每次只能抽2个;Pro用户每次可以抽4个。

5. 预设风格

比如纸板画、电影质感、定格动画等等。

好,讲完了参数,咱们直接上手玩玩核心功能。

这里我输入一个非常简单的prompt——

a dog flying to a pig

一只狗在飞向一只猪

这个镜头很好理解的吧!

这时,如果你点Storyboard按钮,它就会把你这句提示词扩展成下面这个样子:







请到「今天看啥」查看全文