从 12 月 5 日开始,
OpenAI
宣布 12 天召开 12 场新品发布会;终于,在第 3 天也就是
12 月 10 日凌晨
,OpenAI 的生成视频模型
Sora 正式上线了!
这距离 OpenAI 首次公开预告这款产品已过去 10 个月了。
今年年初发布预告的时候,它就
吸引了不少人的关注
,
来源:微信
来源:微博
来源:新闻联播官方微信公众号
毕竟在各个 AI 视频产品都能够生成 5 秒 10 秒的视频的时候,
Sora 只需要一小段文字,就能生成出画面精美的 20 秒的视频
。
来源:小红书
如今正式版的 Sora 更是带着
强大的视频生成能力
向人们走来。
还增加了一系列功能方便用户
对生成的视频进行多种操作
,包括:
▌
Style presets(风格预设)
:创建视频的风格等操作,比如纸板与工艺品、档案、黑色电影等风格;
▌
Remix(重混)
:替换、删除或重构视频中的元素;
▌
Re-cut(重新切割)
:找到最佳的一帧进行延展,循环剪辑;
来源:微信
▌
Loop(循环)
:生成无缝重复的视频
▌
Blend(混合)
:将两个视频合并为一个无缝的视频
来源:微信
▌
Storyboard(故事板)
:精准指定每个帧的输入,并组织和编辑视频的独特序列。
一经上线,Sora 的服务器就被跃跃欲试的全球用户
挤爆了
,网站一度崩溃,OpenAI 不得不间歇性关闭用户的登录入口,CEOSamAltman 发文安抚:“
由于需求超出预期,还需要一段时间才能让每个人都能访问它
,我们正在全力以赴找出问题!”
再一次,
Sora 及其背后团队,来到聚光灯中心
。
这支团队十分年轻,有两位负责人都是
去年(2023 年)伯克利人工智能学院博士毕业
、刚加入研究团队的,另外团队里其他成员也有许多都是
名校毕业
……
这些天才成员们的
优秀履历
,也在持续引爆关注,
负责人——Tim Brooks
,也是
DALL-E 3
(OpenAI 发布的文生图工具)的作者,去年 1 月刚从
加州大学伯克利分校
博士毕业。在伯克利读博期间,Tim 的主要研究方向就是
图片与视频生成
,校园期间,Tim 与导师 Alexei Efros 教授和同组博士后 Aleksander Holynski (现在谷歌)一起研制了
AI 图片编辑工具 InstructPix2Pix
,并入选
CVPR 2023 Highlight
。
图片来源:arXiv
负责人——William Peebles
,
与 Tim 师出同门
、比 Tim 晚
4 个月
毕业。他在正式开始读博之前,还参加了
Adobe
的暑期实习,其研究项目和(时任)卡内基梅隆大学华人学者朱俊彦(也是 Efros 教授学生,现在在 MIT)组有合作,并成为
CVPR 2022 最佳论文候选
。
图片来源:arXiv
之后,Peebles 到伯克利 Efros 教授课题组攻读博士,研究成果
多次入选 SIGGRAPH、ICCV、CVPR 等计算机顶会
。2022 年 5 月,Bill 到
Meta
进行实习,和谢赛宁合作发表了
DiT 模型
,首次将 Transformer 与扩散模型结合到了一起,该成果
被
ICCV 2023
录用为 Oral 论文
。也正是
DiT 模型被认为是此次发布的 Sora 的构建基础
。
图片来源:Scalable Diffusion Models with Transformers
成员
——Aditya Ramesh
,则是 OpenAI 的“老人”。他是
DALL-E 的创造者
,主导了三代 DALL-E 的研究,
对应的三篇论文他都是共同一作
。在
本科期间,Ramesh 也发表过多篇论文
。
图片来源:arXiv
根据 Aditya Ramesh 所说,Sora 团队的不少成员都是
DALL-E 3
的作者,
成员
——Connor Holmes
,毕业于
科罗拉多矿业大学
,电气电子工程学士、高性能计算博士。此前一直在
微软
从事研究员相关工作,有着丰富的
工作经验
。2023 年 12 月加入 OpenAI,参与
Sora、DALL·E
等项目,一直致力于解决在推理和训练深度学习任务时遇到的系统效率问题。在
LLM、BERT 风格
编码器
、
循环神经网络(RNNs)和 UNets
等领域都拥有丰富经验。
不知道同学们有没有发现,无论是团队负责人还是成员,除了年轻,还有一个
共同特点
——
发表过多篇论文,甚至是顶会,或者有丰富的研究经历
。
你是否也想成为
这样优秀团队中的一员,成为聚光灯下、万众瞩目的“天才少年”,用心中热爱引领行业变革和
时代发展?那么首先,你需要积累扎实的学术经历,拥有具有说服力的学术成果。
这一次,我们帮你实现!
如果你也想要进入到这一领域中,迫切想要一位伯乐为你指明道路;如果你一直还在科研大门前徘徊,现在就是你
积累高含金量科研经历,发表高质量论文
的好机会!
本次棕榈实验室提供多个不同科研课题供你选择,在
人工智能
下的热门研究领域都有涵盖,包括
计算机视觉、深度学习、智能机器人
等等,以及和人工智能相结合的
数据科学、金融工程
、
电子工程、机械工程
方向。
我们所选课题兼具
前沿性
和
热门度
,能帮助你在
留学申请或求职
中,充分展现出你的特质,体现差异化,助力在激烈竞争中脱颖而出。
具体课题包括:
👨🚀
▌几何深度学习
🎖
适用专业
计算机/人工智能/深度学习/应用数学/统计/数据科学
⛹️♀️
重磅导师
纽约大学博士
回复【
计算机顶会
】咨询
👨🚀
▌密集人群计数与密度分布估计技术
🎖
适用专业
计算机/计算机视觉/图像处理/卷积神经网络
⛹️♀️
重磅导师
国内 985 高校计算机学院数据存储研究所副所长 副教授
回复【
计算机顶会
】咨询
👨🚀
▌面向虚拟视频会议的人像分割与场景合成技术
🎖
适用专业
计算机/图像处理/元宇宙/虚拟场景合成
⛹️♀️
重磅导师
国内 985 高校计算机学院数据存储研究所副所长 副教授
回复【
计算机顶会
】咨询
👨🚀
▌基于深度学习的移动微人脸辨识技术
🎖
适用专业
计算机/深度学习
/计算机视觉
/图像处理/人脸识别
⛹️♀️
重磅导师
国内 985 高校计算机学院数据存储研究所副所长 副教授
回复【
计算机顶会
】咨询
👨🚀
▌深度学习&金融工程
🎖
适用专业
计算机/人工智能/深度学习/金融工程/统计
📑
课程形式
可选课题 1:鲁棒贝叶斯优化在金融领域的应用
可选课题 2:深度学习在资产优化/风险管理方向应用
可选课题 3:可在导师辅导范围内协商定制
⛹️♀️
重磅导师
新加坡管理大学教授 Pro.L
回复【
计算机顶会
】咨询
👨🚀
▌基于学习的高精度机器人控制
🎖
适用专业
机器人/机械工程/电子工程/计算机/数学
⛹️♀️
重磅导师
哈佛大学博士后
回复【
计算机顶会
】咨询