OpenAI 开放满血 o1 API；YouTube 让内容创作者选择允许其视频用于第三方 AI 训练；智谱完成 30 亿元融资

算法与数据结构 · 公众号 · 算法 · 2024-12-18 11:12

正文

0、豆包MarsCode AI编程挑战启动！

豆包MarsCode AI编程巅峰挑战赛正在火热报名中！

参赛选手可通过扫描下方海报二维码或点击原文链接 登录大赛官方网站进行注册、赛道选择、报名、组队。

根据大赛赛程安排，12月16日起初赛作品提交通道开启，已完成大赛初赛作品的参赛团队可按要求将作品提交至大赛组委会。

详情：https://mp.weixin.qq.com/s/BDKnqPKWYX5GrOjIXxLgrQ

1、OpenAI 开放满血 o1 API

北京时间今天凌晨，在 OpenAI 第九场发布会上，其焦点主要放在 API 和开发者服务的全新升级上，并宣布向 API 使用等级 5 级的开发者开放 OpenAI o1 API 的访问权限。

据官方介绍，现已正式上线的 o1 具备多项关键功能，可支持实际应用场景如下：

函数调用：无缝连接 o1 与外部数据和 API。
结构化输出：生成可靠地遵循自定义 JSON 模式的响应。
开发者指令：为模型指定指令或上下文，例如定义语气、风格以及其他行为指导。
视觉能力：推理图像，开启更多科学、制造或编程领域的应用，特别是在视觉输入至关重要的场景中。
更低延迟：与 o1-preview 相比，o1 在处理相同请求时，推理 token 使用量平均减少 60%。
OpenAI 对 Realtime API 也进行了全面升级。新版本特别适合开发语音助手、实时翻译工具等应用场景。同时，Realtime API 能够集成到智能眼镜等可穿戴设备中，或者轻松接入各类摄像头和麦克风系统。Realtime API 此次更新重点包括 WebRTC 直接集成、价格调整以及更精细的响应控制。

据介绍，WebRTC 可自动处理音频编码、流媒体传输、降噪和拥塞控制等关键功能，即使在网络条件不稳定的情况下也能保证流畅的用户体验。

Realtime API 还新增了多项实用功能：

后台任务，如内容审核或分类，可以在不干扰用户语音互动的情况下进行。
允许自定义输入上下文，指定哪些对话内容作为模型的输入。
控制响应时机，利用服务器端语音活动检测（VAD），但不自动触发回应。
延长最大会话时长，将原本 15 分钟的会话时长增加到 30 分钟。

在定价方面，OpenAI 大幅下调了相关服务费用：gpt-4o-realtime-preview-2024-12-17 音频 token 价格下调 60%，降至每百万输入 token 40 美元，每百万输出 token 80 美元；音频输入缓存费用仅需每百万 token 2.50 美元，大幅下降 87.5%；同时推出的 GPT-4o mini 为开发者提供了更具性价比的选择，在保持体验的同时，将音频价格设定为每百万输入 token 10 美元，每百万输出 token 20 美元，文本 token 则分别为 0.60 美元和 2.40 美元。

另外，此次更新还为微调 API 带来了偏好微调（Preference Fine-Tuning）技术。其采用直接偏好优化(DPO)技术，通过比较模型响应来训练 AI 区分用户偏好。最后，OpenAI 还发布了 Go 和 Java SDK 测试版，与现有的 Python、Node.js 和 .NET 库一起，为开发者提供更全面的开发工具支持。

直播活动结束后，OpenAI 也在 Reddit 论坛上举办了 AMA（Ask Me Anything）活动。问答中，OpenAI 确认计划在 Assistants 中支持 o1，同时将在明年对 Assistants API 进行迭代和改进。

2、马斯克展示 Grok2 新功能

马斯克秀了波 Grok 的新功能 ——Grok 搜索按钮已被嵌入到每篇 X 帖子中。现在，X 上的每篇帖子旁边都有一个 Grok 按钮，你可以一键让人工智能总结这篇帖子，AI 会给出要点并进行适当联想。

在马斯克给出的例子中【视频】，他夸了一下特斯拉，AI 不仅 get 到了这一点，还解释了马斯克的引用文章，并拓展了特斯拉 AI 发展的背景信息。

类似于 GPT Search，Grok 搜索功能同样支持网页来源、关联词汇扩展以及继续提问等功能。（微博量子位）

3、YouTube 让内容创作者选择允许其视频用于第三方 AI 训练

4、智谱完成 30 亿元融资，总估值超 200 亿元

大模型独角兽智谱宣布近期完成新一轮 30 亿元融资。新的投资方包括多家战投及国资，君联资本等老股东继续跟投。

本轮融资将用于智谱 GLM 大模型系列的进一步研发，从回答问题到解决复杂推理、多模态任务，更好地支撑行业生态发展。这是智谱近三个月来的第二轮融资。就在 9 月，中关村科学城公司宣布以投前 200 亿估值领投智谱，智谱也是国内估值率先超过 200 亿的大模型创业企业。

5、宇树科技王兴兴：5 年内，人形机器人成本会降到 2 万元

近日，在极客公园创新大会 2025 上，宇树科技创始人兼 CEO 王兴兴在交流中分享，5 年内，人形机器人成本会降到 2 万元。

王兴兴预测，未来 2-3 年或 3-5 年之后，一台人形机器人的成本可能不会超过 10 台空调。并且他认为，未来人形机器人真正大规模发展以后，整个生产力结构是会改变的。

同时，王兴兴认为，人形机器人有开源就能做出来，关键是把各方面做到极致。他表示，人形机器人的未来竞争要分两部分，一是与传统的消费电子产品类似的产品竞争，二是决定整个机器人 AI 能力天花板的竞争。

6、影石 Insta360 发布 AI 双摄视频会议一体机 Connect

7、英伟达 GB300芯片量产受阻，元件存在严重过热问题

8、美国特斯拉新车自动驾驶电脑被曝大面积故障：摄像头校准引发短路