专栏名称: 棕榈大道
棕榈大道成立于斯坦福大学,拥有来自世界名校4000+导师提供学术、实践背景提升及海外硕博申请指导。 咨询美国本科申请请关注公众号: palmdrive_undergrad 咨询美高申请请关注公众号: palmdrive_highschool
目录
相关文章推荐
湖北经视  ·  撒贝宁悼念! ·  昨天  
北京本地宝  ·  北京2025年5个重大地标! ·  5 天前  
湖北经视  ·  最新通报!4名嫌犯(3男1女)已被缉拿归案 ·  3 天前  
51好读  ›  专栏  ›  棕榈大道

重磅!OpenAI的Sora终于上线了,扒一扒背后团队的成功秘籍

棕榈大道  · 公众号  ·  · 2024-12-17 21:30

正文

星标/置顶 我们,获取免费讲座、限量学术干货


从 12 月 5 日开始, OpenAI 宣布 12 天召开 12 场新品发布会;终于,在第 3 天也就是 12 月 10 日凌晨 ,OpenAI 的生成视频模型 Sora 正式上线了! 这距离 OpenAI 首次公开预告这款产品已过去 10 个月了。



来源:X


今年年初发布预告的时候,它就 吸引了不少人的关注


来源:微信


来源:微博


来源:新闻联播官方微信公众号


毕竟在各个 AI 视频产品都能够生成 5 秒 10 秒的视频的时候, Sora 只需要一小段文字,就能生成出画面精美的 20 秒的视频


来源:小红书


如今正式版的 Sora 更是带着 强大的视频生成能力 向人们走来。


来源:微信


还增加了一系列功能方便用户 对生成的视频进行多种操作 ,包括:


Style presets(风格预设) :创建视频的风格等操作,比如纸板与工艺品、档案、黑色电影等风格;


来源:微信

Remix(重混) :替换、删除或重构视频中的元素;



将门外的场景由图书馆换成月球   来源:微信


Re-cut(重新切割) :找到最佳的一帧进行延展,循环剪辑;


来源:微信


Loop(循环) :生成无缝重复的视频


Blend(混合) :将两个视频合并为一个无缝的视频


来源:微信


Storyboard(故事板) :精准指定每个帧的输入,并组织和编辑视频的独特序列。

来源:微信


一经上线,Sora 的服务器就被跃跃欲试的全球用户 挤爆了 ,网站一度崩溃,OpenAI 不得不间歇性关闭用户的登录入口,CEOSamAltman 发文安抚:“ 由于需求超出预期,还需要一段时间才能让每个人都能访问它 ,我们正在全力以赴找出问题!”


来源:X


再一次, Sora 及其背后团队,来到聚光灯中心

这支团队十分年轻,有两位负责人都是 去年(2023 年)伯克利人工智能学院博士毕业 、刚加入研究团队的,另外团队里其他成员也有许多都是 名校毕业 ……


这些天才成员们的 优秀履历 ,也在持续引爆关注,


负责人——Tim Brooks ,也是 DALL-E 3 (OpenAI 发布的文生图工具)的作者,去年 1 月刚从 加州大学伯克利分校 博士毕业。在伯克利读博期间,Tim 的主要研究方向就是 图片与视频生成 ,校园期间,Tim 与导师 Alexei Efros 教授和同组博士后 Aleksander Holynski (现在谷歌)一起研制了 AI 图片编辑工具 InstructPix2Pix ,并入选 CVPR 2023 Highlight


图片来源:arXiv


负责人——William Peebles 与 Tim 师出同门 、比 Tim 晚 4 个月 毕业。他在正式开始读博之前,还参加了 Adobe 的暑期实习,其研究项目和(时任)卡内基梅隆大学华人学者朱俊彦(也是 Efros 教授学生,现在在 MIT)组有合作,并成为 CVPR 2022 最佳论文候选


图片来源:arXiv


之后,Peebles 到伯克利 Efros 教授课题组攻读博士,研究成果 多次入选 SIGGRAPH、ICCV、CVPR 等计算机顶会 。2022 年 5 月,Bill 到 Meta 进行实习,和谢赛宁合作发表了 DiT 模型 ,首次将 Transformer 与扩散模型结合到了一起,该成果 ICCV 2023 录用为 Oral 论文 。也正是 DiT 模型被认为是此次发布的 Sora 的构建基础


图片来源:Scalable Diffusion Models with Transformers


成员 ——Aditya Ramesh ,则是 OpenAI 的“老人”。他是 DALL-E 的创造者 ,主导了三代 DALL-E 的研究, 对应的三篇论文他都是共同一作 。在 本科期间,Ramesh 也发表过多篇论文


图片来源:arXiv


根据 Aditya Ramesh 所说,Sora 团队的不少成员都是 DALL-E 3 的作者,


成员 ——Connor Holmes ,毕业于 科罗拉多矿业大学 ,电气电子工程学士、高性能计算博士。此前一直在 微软 从事研究员相关工作,有着丰富的 工作经验 。2023 年 12 月加入 OpenAI,参与 Sora、DALL·E 等项目,一直致力于解决在推理和训练深度学习任务时遇到的系统效率问题。在 LLM、BERT 风格 编码器 循环神经网络(RNNs)和 UNets 等领域都拥有丰富经验。


......

不知道同学们有没有发现,无论是团队负责人还是成员,除了年轻,还有一个 共同特点 —— 发表过多篇论文,甚至是顶会,或者有丰富的研究经历

你是否也想成为 这样优秀团队中的一员,成为聚光灯下、万众瞩目的“天才少年”,用心中热爱引领行业变革和 时代发展?那么首先,你需要积累扎实的学术经历,拥有具有说服力的学术成果。 这一次,我们帮你实现!



如果你也想要进入到这一领域中,迫切想要一位伯乐为你指明道路;如果你一直还在科研大门前徘徊,现在就是你 积累高含金量科研经历,发表高质量论文 的好机会!


本次棕榈实验室提供多个不同科研课题供你选择,在 人工智能 下的热门研究领域都有涵盖,包括 计算机视觉、深度学习、智能机器人 等等,以及和人工智能相结合的 数据科学、金融工程 电子工程、机械工程 方向。


我们所选课题兼具 前沿性 热门度 ,能帮助你在 留学申请或求职 中,充分展现出你的特质,体现差异化,助力在激烈竞争中脱颖而出。


具体课题包括:


👨‍🚀 ▌几何深度学习


🎖 适用专业

计算机/人工智能/深度学习/应用数学/统计/数据科学


⛹️‍♀️ 重磅导师

纽约大学博士


📑 课程形式
  • 一对一定制辅导

  • 计算机/深度学习-CCF 论文


回复【 计算机顶会 】咨询


👨‍🚀 ▌密集人群计数与密度分布估计技术


🎖 适用专业

计算机/计算机视觉/图像处理/卷积神经网络


⛹️‍♀️ 重磅导师

国内 985 高校计算机学院数据存储研究所副所长  副教授


📑 课程形式
  • 一对一定制辅导

  • 计算机视觉-CCF 论文(拟投会议 IEEE CVPR / ICME 或 ACCV )


回复【 计算机顶会 】咨询


👨‍🚀 ▌面向虚拟视频会议的人像分割与场景合成技术


🎖 适用专业

计算机/图像处理/元宇宙/虚拟场景合成


⛹️‍♀️ 重磅导师

国内 985 高校计算机学院数据存储研究所副所长  副教授


📑 课程形式
  • 一对一定制辅导

  • 计算机视觉-CCF 论文(拟投会议 ACM MM / IEEE ICME / ISMAR / IEEEICVRV等)


回复【 计算机顶会 】咨询


👨‍🚀 ▌基于深度学习的移动微人脸辨识技术


🎖 适用专业

计算机/深度学习 /计算机视觉 /图像处理/人脸识别


⛹️‍♀️ 重磅导师

国内 985 高校计算机学院数据存储研究所副所长  副教授


📑 课程形式
  • 一对一定制辅导

  • 计算机视觉-CCF 论文(拟投会议 IEEE ICME 或 IEEEICPC等)


回复【 计算机顶会 】咨询


👨‍🚀 ▌深度学习&金融工程


🎖 适用专业

计算机/人工智能/深度学习/金融工程/统计


📑 课程形式

可选课题 1:鲁棒贝叶斯优化在金融领域的应用

可选课题 2:深度学习在资产优化/风险管理方向应用

可选课题 3:可在导师辅导范围内协商定制


⛹️‍♀️ 重磅导师

新加坡管理大学教授 Pro.L


📑 课程形式
  • 一对一定制辅导

  • CCF 论文


回复【 计算机顶会 】咨询


👨‍🚀 ▌基于学习的高精度机器人控制


🎖 适用专业

机器人/机械工程/电子工程/计算机/数学


⛹️‍♀️ 重磅导师

哈佛大学博士后


📑 课程形式
  • 一对一定制辅导

  • 拟投 CCF 或 IEEE 或同等级别会议,B 类及以上


回复【 计算机顶会 】咨询


项目特色








请到「今天看啥」查看全文