华尔街日报对OpenAI CTO Mira Murati 关于 Sora 的采访视频完整版(双语字幕)
1. 发布时间:OpenAI希望Sora最快在几个月内向公众开放,有可能在2024年内,但要避开影响全球选举等重大事件的敏感时期。
2. 生成视频速度:目前生成一个片段需要几分钟,取决于任务复杂性。未来会致力于性能优化。
3. 主要缺陷:物体连续性和手部动作等细节处理还不够完美,如出租车消失又出现,人物手指数量异常等。
4. 训练数据:使用了公开和经许可的数据,包括Shutterstock等来源,具体数据集没有透露。
5. 原理:Sora是一个扩散模型,通过分析大量视频学习,根据文本提示在时间线上添加细节来构建连贯场景。
6. 声音:目前Sora还不支持声音,未来会考虑添加音频功能。
7. 计算资源:生成一个Sora视频的成本远高于一个DALL-E图像或ChatGPT回复,目标是将来达到类似DALL-E的使用成本。
8. 安全性:正在进行风险评估与安全测试,考虑限制生成公众人物等敏感内容,研究给视频打水印等方法区分真实内容。
9. 裸露内容:对于是否允许生成裸体艺术内容,还在与艺术家讨论政策制定中,暂不确定。
原始视频:网页链接 宝玉xp的微博视频
1. 发布时间:OpenAI希望Sora最快在几个月内向公众开放,有可能在2024年内,但要避开影响全球选举等重大事件的敏感时期。
2. 生成视频速度:目前生成一个片段需要几分钟,取决于任务复杂性。未来会致力于性能优化。
3. 主要缺陷:物体连续性和手部动作等细节处理还不够完美,如出租车消失又出现,人物手指数量异常等。
4. 训练数据:使用了公开和经许可的数据,包括Shutterstock等来源,具体数据集没有透露。
5. 原理:Sora是一个扩散模型,通过分析大量视频学习,根据文本提示在时间线上添加细节来构建连贯场景。
6. 声音:目前Sora还不支持声音,未来会考虑添加音频功能。
7. 计算资源:生成一个Sora视频的成本远高于一个DALL-E图像或ChatGPT回复,目标是将来达到类似DALL-E的使用成本。
8. 安全性:正在进行风险评估与安全测试,考虑限制生成公众人物等敏感内容,研究给视频打水印等方法区分真实内容。
9. 裸露内容:对于是否允许生成裸体艺术内容,还在与艺术家讨论政策制定中,暂不确定。
原始视频:网页链接 宝玉xp的微博视频