Open AI 主要领导层昨晚在 Reddit 做了一次 AMA。
#ai#
回答很多重要重要问题的规划,可以看看,重点的有:
- OpenAI 认为可以用现有硬件实现 AGI
- 今年没不会发布 GPT-5 模型,不过之后会有重要发布
- 今年主要任务是优化 O1
- GPT 和 o1 两个模型系列最终会合并
- 正在开发新的图像生成模型
原始总结:x.com/btibor91/status/1852097331379700085
完整内容:
OpenAI Sam Altman、Kevin Weil、Srinivas Narayanan 和 Mark Chen 在 Reddit 上的 AMA 总结(2024-10-31)
GPT-5 和即将推出的模型
- 今年没有计划发布名为 GPT-5 的模型,不过之后会有重要发布
- 目前重点是改进 o1 系列及其后续版本,而不是推出 GPT-5
GPT 与 o1 模型系列
- OpenAI 将继续开发 GPT 和 o1 两个模型系列
- 预计这两个系列最终会合并
- 完整版 o1 模型即将发布,相比目前的 o1-preview 有明显改进
更长的上下文窗口
- OpenAI 正在为 ChatGPT Plus 和 GPT-4o 增加上下文窗口
- 目前的 32k 令牌上下文窗口对于较长任务(特别是编程或写作)来说仍显不足
- 扩展上下文窗口是一个公认的需求,相关工作正在进行中
图像模型和 GPT-4o 的"渲染"功能
- 新的文本生成图像模型正在开发中,但未宣布发布日期
- o1 模型将在未来几个月支持图像输入,以及多模态和工具使用等功能
- GPT-4o 可以通过 HTML 提示直接"渲染"和生成图像,具有令人印象深刻的图像转换能力
SearchGPT、出版商和分析
- OpenAI 认同让出版商能够查看他们如何被引用的想法,但目前尚无具体计划
- SearchGPT 在处理复杂查询时通常比传统搜索引擎更快更高效
- 他们设想搜索功能能够根据用户查询创建动态的、定制的网页
AGI(通用人工智能)
- OpenAI 认为可以用现有硬件实现 AGI
- 一旦实现 AGI,可能加速科学发现,特别是在健康和医疗领域
- 架构突破(可能由现有模型提出)可能有助于实现 AGI
- OpenAI 正在探索用特定医学文献训练模型以提升该领域的表现
- 正在为企业产品开发 HIPAA 合规功能
代理和 2025 年展望
- ChatGPT 独立执行任务的能力预计将成为 2025 年的主要主题
- 代理预计将是 GPT 产品线的下一个重大突破
- 大胆预测到 2025 年,所有基准测试都将达到饱和
高级语音模式(AVM)和新功能
- OpenAI 正在放宽对音乐功能的限制,包括使 ChatGPT 能够唱歌
- 正在开发具有视觉功能的高级语音模式和相机模式,但未公布发布时间表
- 模型处理中断的能力已有改善,这需要大量的设计工作
开源和可访问性
- OpenAI 认可开源模型在 AI 生态系统中的重要性,希望未来能开源更多内容
- 目前专注于提供强大且安全的 API 和服务以满足安全要求
NSFW 内容和用户控制
- OpenAI 认为应该让成年人控制 NSFW 内容,但正确实现比较复杂
- NSFW 控制目前不是最优先事项,其他领域更为紧迫
- OpenAI 计划在资源允许时解决这个问题
推理成本和 API 定价
- 过去一年推理成本降低了约 10 倍
- GPT-4o-mini 等模型的成本现在约为原始 GPT-3 的 2%
- 预计成本降低趋势将持续,包括语音等高级功能
对 AI 爱好者的建议和使用案例
- OpenAI 鼓励日常使用 AI 工具以提高生产力和产生想法
- 适应能力和快速学习被视为未来的关键技能
- 用户正在使用 ChatGPT 总结医疗报告和创建自定义 GPT,如课程笔记或旅行建议
- 鼓励构建有趣的项目并与他人分享,以贡献 AI 领域
- OpenAI 愿意建立合作伙伴关系,帮助企业更快采用 AI
减少幻觉和模型改进
- OpenAI 专注于减少幻觉,虽然这是一个具有挑战性的问题
- 模型在引用可信来源方面有所改进,这有助于减少错误信息
- 正在使用强化学习来奖励准确性并减少幻觉
多语言改进
- OpenAI 正在努力提高英语以外语言的性能
- GPT-4o 在处理多语言方面相比早期模型有显著进步
- 提升多语言能力仍是一个优先事项
ChatGPT 的早期接受度
- OpenAI 对人们对 ChatGPT 早期版本的积极反响感到惊讶
- 初始产品有许多局限性,包括不准确和功能缺失,但仍然找到了强大的用户群
- 尽管存在不完善之处,用户仍然发现原型很有价值
欧盟法规
- OpenAI 将遵守欧盟政策,同时也希望有越来越合理的法规
回答很多重要重要问题的规划,可以看看,重点的有:
- OpenAI 认为可以用现有硬件实现 AGI
- 今年没不会发布 GPT-5 模型,不过之后会有重要发布
- 今年主要任务是优化 O1
- GPT 和 o1 两个模型系列最终会合并
- 正在开发新的图像生成模型
原始总结:x.com/btibor91/status/1852097331379700085
完整内容:
OpenAI Sam Altman、Kevin Weil、Srinivas Narayanan 和 Mark Chen 在 Reddit 上的 AMA 总结(2024-10-31)
GPT-5 和即将推出的模型
- 今年没有计划发布名为 GPT-5 的模型,不过之后会有重要发布
- 目前重点是改进 o1 系列及其后续版本,而不是推出 GPT-5
GPT 与 o1 模型系列
- OpenAI 将继续开发 GPT 和 o1 两个模型系列
- 预计这两个系列最终会合并
- 完整版 o1 模型即将发布,相比目前的 o1-preview 有明显改进
更长的上下文窗口
- OpenAI 正在为 ChatGPT Plus 和 GPT-4o 增加上下文窗口
- 目前的 32k 令牌上下文窗口对于较长任务(特别是编程或写作)来说仍显不足
- 扩展上下文窗口是一个公认的需求,相关工作正在进行中
图像模型和 GPT-4o 的"渲染"功能
- 新的文本生成图像模型正在开发中,但未宣布发布日期
- o1 模型将在未来几个月支持图像输入,以及多模态和工具使用等功能
- GPT-4o 可以通过 HTML 提示直接"渲染"和生成图像,具有令人印象深刻的图像转换能力
SearchGPT、出版商和分析
- OpenAI 认同让出版商能够查看他们如何被引用的想法,但目前尚无具体计划
- SearchGPT 在处理复杂查询时通常比传统搜索引擎更快更高效
- 他们设想搜索功能能够根据用户查询创建动态的、定制的网页
AGI(通用人工智能)
- OpenAI 认为可以用现有硬件实现 AGI
- 一旦实现 AGI,可能加速科学发现,特别是在健康和医疗领域
- 架构突破(可能由现有模型提出)可能有助于实现 AGI
- OpenAI 正在探索用特定医学文献训练模型以提升该领域的表现
- 正在为企业产品开发 HIPAA 合规功能
代理和 2025 年展望
- ChatGPT 独立执行任务的能力预计将成为 2025 年的主要主题
- 代理预计将是 GPT 产品线的下一个重大突破
- 大胆预测到 2025 年,所有基准测试都将达到饱和
高级语音模式(AVM)和新功能
- OpenAI 正在放宽对音乐功能的限制,包括使 ChatGPT 能够唱歌
- 正在开发具有视觉功能的高级语音模式和相机模式,但未公布发布时间表
- 模型处理中断的能力已有改善,这需要大量的设计工作
开源和可访问性
- OpenAI 认可开源模型在 AI 生态系统中的重要性,希望未来能开源更多内容
- 目前专注于提供强大且安全的 API 和服务以满足安全要求
NSFW 内容和用户控制
- OpenAI 认为应该让成年人控制 NSFW 内容,但正确实现比较复杂
- NSFW 控制目前不是最优先事项,其他领域更为紧迫
- OpenAI 计划在资源允许时解决这个问题
推理成本和 API 定价
- 过去一年推理成本降低了约 10 倍
- GPT-4o-mini 等模型的成本现在约为原始 GPT-3 的 2%
- 预计成本降低趋势将持续,包括语音等高级功能
对 AI 爱好者的建议和使用案例
- OpenAI 鼓励日常使用 AI 工具以提高生产力和产生想法
- 适应能力和快速学习被视为未来的关键技能
- 用户正在使用 ChatGPT 总结医疗报告和创建自定义 GPT,如课程笔记或旅行建议
- 鼓励构建有趣的项目并与他人分享,以贡献 AI 领域
- OpenAI 愿意建立合作伙伴关系,帮助企业更快采用 AI
减少幻觉和模型改进
- OpenAI 专注于减少幻觉,虽然这是一个具有挑战性的问题
- 模型在引用可信来源方面有所改进,这有助于减少错误信息
- 正在使用强化学习来奖励准确性并减少幻觉
多语言改进
- OpenAI 正在努力提高英语以外语言的性能
- GPT-4o 在处理多语言方面相比早期模型有显著进步
- 提升多语言能力仍是一个优先事项
ChatGPT 的早期接受度
- OpenAI 对人们对 ChatGPT 早期版本的积极反响感到惊讶
- 初始产品有许多局限性,包括不准确和功能缺失,但仍然找到了强大的用户群
- 尽管存在不完善之处,用户仍然发现原型很有价值
欧盟法规
- OpenAI 将遵守欧盟政策,同时也希望有越来越合理的法规