专栏名称: 奇舞精选
《奇舞精选》是由奇舞团维护的前端技术公众号。除周五外,每天向大家推荐一篇前端相关技术文章,每周五向大家推送汇总周刊内容。
目录
相关文章推荐
疯狂区块链  ·  今年楼市不会好的三大原因 ·  昨天  
二郎专注互联网  ·  小白不知道的 web3空投! ·  2 天前  
白话区块链  ·  为何本轮比特币牛市也如此艰难?还有机会吗? ·  2 天前  
疯狂区块链  ·  谁还在相信人性? ·  2 天前  
疯狂区块链  ·  无量仙翁是好人坏人? ·  3 天前  
51好读  ›  专栏  ›  奇舞精选

一文回顾 OpenAI 12天发布会

奇舞精选  · 公众号  ·  · 2024-12-25 18:00

正文

本文作者系360奇舞团前端开发工程师

OpenAI 在12月5日正式宣布将举行为期12天的系列发布活动,期间每天发布一个产品或样品,活动将包括备受期待的AI视频生成工具 Sora 和新的推理模型,本文将简单总结介绍为期12天的发布会每日的内容

第一天

完全体的 o1

从能力上看,o1 比 Preview 版本有了比较大的提升

1、在国际数学奥林匹克预选赛题目(AIME 2024)、编程能力测试(CodeForces)方面都比 o1-preview 提升了接近50%
2、在处理复杂问题时的重大错误率降低了34%
3、支持多模态识别,能够同时处理文字、图片、语音等输入

此外还新增了 Pro 订阅服务,每月200刀,可以无限制使用 OpenAI 所有模型以及应用

免费版目前还是不能使用,Plus 订阅用户每天可以使用20次,Pro 订阅用户可以无限制使用

第二天

o1-mini 强化微调

该项目允许开发者将公司的模型训练成特定领域的专家模型,通过极少的高质量的数据对模型进行微调,加强模型在特定领域的推理能力,从而提高模型的应用能力

现阶段的主要面向人群是企业、机构、大学生,不过 OpenAI 计划在2025年会面向公众,开放该项目的 API 使用权限

第三天

Sora turbo

Sora Turbo 版本能够生成1080p、最长20秒的视频,并且支持横屏、正方形和竖屏等多种常见比例,在视频的画质和时长都有显著的提升

同时也支持了对生成的视频进行重混、切割、混合、故事板剪辑、风格预设等操作、用户可以根据自己的需求对视频进行二次创作(海外版剪映)

除了可以二次创作,而且还可以将生成的视频分享到社区,同时也可以在社区看到其他用户分享的视频,激发更多的创作灵感

免费版目前还是不能使用,Plus 订阅用户每月可以使用50次,Pro 订阅用户可以无限制使用(慢速生成)

第四天

Canvas

Canvas 是集成智能写作、代码协作、AI 智能体为一体的工作台

此次发布相较于之前,支持了 python 代码运行环境,可以针对上下文代码进行调试编辑,同时支持定制化 Agent 能力,可以帮助我们完成一系列操作,帮助我们发邮件、点外卖、打车等等

之前只有订阅用户可以使用,现在已向所有免费用户开放使用

第五天

Apple Intelligence

Chatgpt 正式集成到 Apple Intelligence,升级到 IOS18.2 的用户,就可以在 iPhone、iPad、Mac、通过 Siri 来使用 Chatgpt,还特别针对文档以及相机做了部分优化

1、现在用户可以使用Chatgpt从头开始撰写文档,实时对文档进行细化和总结

2、可以通过拍照对图片中的内容进行识别优化,快速获得图片相关信息

国行版本目前不支持 Apple Intelligence,但大概率会在 2025 年使用上

第六天

高级视频语音模式

Chatgpt 的高级语音模式,新增 视频聊天功能 以及 屏幕共享功能 ,使 Chatgpt 能够看到用户和用户周围的环境,基于这些视觉信息,更好的理解用户的的指令以及问题

还可以通过屏幕共享功能,帮助用户回复消息、辅助工作和学习等场景

Plus 以及 Pro 订阅用户可以免费使用

第七天

Projects

支持用户将相关资料、文件、聊天记录等信息集中到一个“Project”中,支持项目管理与写作、文件与数据管理、个性化定制等场景。还整合了 Canvas 和 ChatGPT Search

这一创新功能简化了项目管理以及团队协作,适用于团队管理、内容创作等多种场景

Plus 以及 Pro 订阅用户可以免费使用

第八天

Chatgpt Search 功能升级,且免费开放

Chatgpt 搜索功能正式向所有免费用户开放

1、针对搜索速度相应做了优化,用户体验更加流畅
2、允许用户使用语音搜索,以自然对话的方式获取检索内容
3、原生支持实时网络搜索,为用户提供最新的互联网信息
4、搜索功能加入地图体验,用户可以实时获取地理位置等相关信息

第九天

o1 推理模型开放 API

o1模型正式推出 API,可定制升级,新增函数调用,开发者消息和图像分析等功能,是一次重要的技术升级

1、模型不仅变得更聪明,还能更快地回应用户需求,在性能方面有一定提升
2、不仅对实时 API 进行了全面升级,还包括引入 WebRTC 支持,极大简化了实时语音应用的开发成本
3、相关服务的价格大幅下调,其中 4o 的音频处理费用更是降低了 60%

第十天

通过电话以及 WhatsApp 使用 Chatgpt

用户可以通过电话和 WhatsApp 使用 ChatGPT 的新功能。这一更新意味着用户可以通过最基础的电话功能或 WhatsApp 与 AI 进行对话,号码是1-800-CHAT-GPT,或者是 1-800-242-8478。支持智能手机,老人机和座机等设备。极大地降低了使用门槛(尊老爱幼)

美国用户每个月有15分钟的免费通话时间

第十一天

桌面应用集成

ChatGPT 与 Mac 应用的深度集成,在编程和写作方面进行了更新。现在,用户可以通过简单的复制粘贴操作,与Warp、XCode等应用协同工作,无需详细交流即可执行任务

Mac 用户将 Chatgpt 升级至最新版即可使用,Windows 用户暂不支持

第十二天

o3

在最后一天,OpenAI 推出了王炸级模型,跳过 o2 ,命名 o3 ,宣称接近通用人工智能(AGI),这一新版本在编码、数学以及 ARC-AGI 基准测试等多个基准上就大幅超过了 OpenAI 此前的 o1 模型

可以看几个数据对比:

Codeforces 评分:2727 ——超过99%的人类程序员。

GPQA科学基准测试中(博士水平的科学问题):87.7% ——博士生一般得分70%

美国 AIME 数学竞赛中:96.7% ——顶级数学家的能力

证明是否达到AGI的题目ARC-AGI:87.5% ——o1的得分25%

虽然 ARC-AGI 测试中表现出色,但这并不意味着 o3 已达到了 AGI 水平,它仍会在一些非常简单的任务中失败,距离人工智能还有一定距离

随着 o3 模型的发布,OpenAI 在最后一天又让我们感受到了2022年底从 ChatGPT 到 GPT4 那段时间 AI 扑面而来的速度,2024年已经接近尾声,相信2025年 AI 这个赛道的发展只会越来越快,AI 也会越来越智能,AGI 也终有一天会到来!

-







请到「今天看啥」查看全文


推荐文章
疯狂区块链  ·  今年楼市不会好的三大原因
昨天
二郎专注互联网  ·  小白不知道的 web3空投!
2 天前
疯狂区块链  ·  谁还在相信人性?
2 天前
疯狂区块链  ·  无量仙翁是好人坏人?
3 天前
庞门正道  ·  听说明天要上班了!
8 年前
冲蒌老伍  ·  生得咁靓女,唱歌竟然...
7 年前
冯站长之家  ·  2017年5月29日价格早报(语音版)
7 年前