0、豆包MarsCode AI编程挑战启动!
豆包MarsCode AI编程巅峰挑战赛正在火热报名中!
参赛选手可通过扫描下方海报二维码或点击原文链接 登录大赛官方网站进行注册、赛道选择、报名、组队。
根据大赛赛程安排,12月16日起初赛作品提交通道开启,已完成大赛初赛作品的参赛团队可按要求将作品提交至大赛组委会。
详情:https://mp.weixin.qq.com/s/BDKnqPKWYX5GrOjIXxLgrQ
1、OpenAI 开放满血 o1 API
北京时间今天凌晨,在 OpenAI 第九场发布会上 ,其焦点主要放在 API 和开发者服务的全新升级上,并宣布向 API 使用等级 5 级的开发者开放 OpenAI o1 API 的访问权限。
据官方介绍,现已正式上线的 o1 具备多项关键功能,可支持实际应用场景如下:
函数调用:无缝连接 o1 与外部数据和 API。
结构化输出:生成可靠地遵循自定义 JSON 模式的响应。
开发者指令:为模型指定指令或上下文,例如定义语气、风格以及其他行为指导。
视觉能力:推理图像,开启更多科学、制造或编程领域的应用,特别是在视觉输入至关重要的场景中。
更低延迟:与 o1-preview 相比,o1 在处理相同请求时,推理 token 使用量平均减少 60%。
OpenAI 对 Realtime API 也进行了全面升级。新版本特别适合开发语音助手、实时翻译工具等应用场景。同时,Realtime API 能够集成到智能眼镜等可穿戴设备中,或者轻松接入各类摄像头和麦克风系统。Realtime API 此次更新重点包括 WebRTC 直接集成、价格调整以及更精细的响应控制。
据介绍,WebRTC 可自动处理音频编码、流媒体传输、降噪和拥塞控制等关键功能,即使在网络条件不稳定的情况下也能保证流畅的用户体验。
Realtime API 还新增了多项实用功能:
后台任务,如内容审核或分类,可以在不干扰用户语音互动的情况下进行。
允许自定义输入上下文,指定哪些对话内容作为模型的输入。
控制响应时机,利用服务器端语音活动检测(VAD),但不自动触发回应。
延长最大会话时长,将原本 15 分钟的会话时长增加到 30 分钟。
在定价方面,OpenAI 大幅下调了相关服务费用:gpt-4o-realtime-preview-2024-12-17 音频 token 价格下调 60%,降至每百万输入 token 40 美元,每百万输出 token 80 美元;音频输入缓存费用仅需每百万 token 2.50 美元,大幅下降 87.5%;同时推出的 GPT-4o mini 为开发者提供了更具性价比的选择,在保持体验的同时,将音频价格设定为每百万输入 token 10 美元,每百万输出 token 20 美元,文本 token 则分别为 0.60 美元和 2.40 美元。
另外,此次更新还为微调 API 带来了偏好微调(Preference Fine-Tuning)技术。其采用直接偏好优化(DPO)技术,通过比较模型响应来训练 AI 区分用户偏好。最后,OpenAI 还发布了 Go 和 Java SDK 测试版,与现有的 Python、Node.js 和 .NET 库一起,为开发者提供更全面的开发工具支持。
直播活动结束后,OpenAI 也在 Reddit 论坛上举办了 AMA(Ask Me Anything)活动。问答中,OpenAI 确认计划在 Assistants 中支持 o1,同时将在明年对 Assistants API 进行迭代和改进。
2、马斯克展示 Grok2 新功能
马斯克秀了波 Grok 的新功能 ——Grok 搜索按钮已被嵌入到每篇 X 帖子中。现在,X 上的每篇帖子旁边都有一个 Grok 按钮,你可以一键让人工智能总结这篇帖子,AI 会给出要点并进行适当联想。
在马斯克给出的例子中【视频】,他夸了一下特斯拉,AI 不仅 get 到了这一点,还解释了马斯克的引用文章,并拓展了特斯拉 AI 发展的背景信息。
类似于 GPT Search,Grok 搜索功能同样支持网页来源、关联词汇扩展以及继续提问等功能。(微博 量子位)
3、YouTube 让内容创作者选择允许其视频用于第三方 AI 训练
YouTube 宣布将在未来几天推出一项可选择加入的功能,让内容创作者和版权所有者选择允许第三方公司使用其视频内容去训练 AI。该选项“Third-party training”位于 YouTube Studio 设置下,默认是不允许。创作者可以选择允许哪些第三方公司,也可以不加选择的允许任何第三方公司。YouTube 表示,未经许可抓取视频的做法是不允许的。
4、智谱完成 30 亿元融资,总估值超 200 亿元
大模型独角兽智谱宣布近期完成新一轮 30 亿元融资。新的投资方包括多家战投及国资,君联资本等老股东继续跟投。
本轮融资将用于智谱 GLM 大模型系列的进一步研发,从回答问题到解决复杂推理、多模态任务,更好地支撑行业生态发展。这是智谱近三个月来的第二轮融资。就在 9 月,中关村科学城公司宣布以投前 200 亿估值领投智谱,智谱也是国内估值率先超过 200 亿的大模型创业企业。
5、宇树科技王兴兴:5 年内,人形机器人成本会降到 2 万元
近日,在极客公园创新大会 2025 上,宇树科技创始人兼 CEO 王兴兴在交流中分享,5 年内,人形机器人成本会降到 2 万元。王兴兴预测,未来 2-3 年或 3-5 年之后,一台人形机器人的成本可能不会超过 10 台空调。并且他认为,未来人形机器人真正大规模发展以后,整个生产力结构是会改变的。同时,王兴兴认为,人形机器人有开源就能做出来,关键是把各方面做到极致。他表示,人形机器人的未来竞争要分两部分,一是与传统的消费电子产品类似的产品竞争,二是决定整个机器人 AI 能力天花板的竞争。