专栏名称: 巴比特资讯

区块链/数字货币/比特币中文资讯，创立于2011年，200多位专栏作入驻平台，国内最大区块链资讯原创基地（公众号【原创】认证），我们为以下合作伙伴供稿：火币、OKCoin、BTC.com、BTCC、币看、BTC123、比特时代、挖币网

目录

相关文章推荐

心禅道 · 投资#785 ... · 昨天

心禅道 · 投资#785 ... · 昨天

闪电HSL · 从中世纪的赎罪券到现代币圈的meme币，从对 ... · 1 周前

51好读 › 专栏 › 巴比特资讯

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2

巴比特资讯 · 公众号 · 比特币 · 2024-11-04 17:47

正文

图片来源：由无界AI生成

本文来源：量子位

o1满血版泄露了！

没想到，OpenAI还搁那儿“今年一定”呢，不少网友已经率先上手体验到了（doge）。

事情是酱婶的：有网友发现，OpenAI已经在ChatGPT官网上部署了完整版o1，大家伙儿还都能卡bug直接用！

最初发现此事的网友，测试确认泄露模型具有奥特曼所说的图像推理能力。

△图源：𝕏@legit_rumors

而日志也显示该模型就是o1本模。

于是，赶在OpenAI出手修复之前，网友们抓紧大玩特玩了一波——

满血o1到底有多牛

和已经发布的o1-preview、o1-mini最直观的不同是，泄露出来的o1支持上传附件。

这也就意味着，终于能测测o1的多模态能力了。

网友们也不说废话，直接上强度，普特南数学竞赛的证明题截图一贴，甩给满血o1。

对正整数n，有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n，使得|fn‘’(0)|＞2023。

思考了18秒之后，o1给出答案：18。

答案正确：

再来一道更复杂的，虽然在识图上遇到了一点小问题，但还是稳稳做对了。

在如此惊艳表现之下，似乎正确识别人类史上首张黑洞照片也不算什么了（doge）。

不过嘛，也不是没有翻车案例。比如，让大模型数数图里有多少个三角形。

ID为anagh的𝕏网友，给泄露模型和GPT-4o做了个同屏对比：

4o速度很快，给出了错误答案19。

而满血o1花了1分39秒，狂刷一堆token……给出了不同的错误答案：29。

正确答案是24。

这个bug现在已经修复了。不过，有意思的是，这次模型泄露，持续了整整3个小时。

不小心还是故意的？

有网友犀利地点出，这事儿看上去不是“不小心”，而是“精心策划”：

目的是让人们对即将发布的模型有一个预期。

不少网友赞同这样的观点：

奥特曼的目的是测试和炒作。

而由于一切看上去已经部署就绪，甚至有人猜测，o1完整版的正式上线时间就在未来一周之内。

值得注意的是，就在这次泄露事件之后，奥特曼马上在𝕏上开始了自己的表演：

好家伙，都已经吹上o2的风了（还假装上错号……）。

至于为什么是这个时间……

那不得赶在Anthropic发布Claude Haiku 3.5之前搞点事嘛（doge）。

中国AIGC产业应用峰会回顾

2024 年 1 月 5 日，【智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会】在杭州未来科技城会议中心举行。

大会汇集行业资深专家及领军企业，共同聚焦AIGC领域，围绕当下热点话题进行深度延展，探讨行业激烈竞争下的运营新思路、发展新模式！点击文章，回顾精彩内容~

请到「今天看啥」查看全文

推荐文章

心禅道 · 投资#785 投资比特币的三个理由，比特币终将突破100万美元，比特币的投资逻辑分析，你为什么选择比特币？

昨天

心禅道 · 投资#785 投资比特币的三个理由，比特币终将突破100万美元，比特币的投资逻辑分析，你为什么选择比特币？

昨天

闪电HSL · 从中世纪的赎罪券到现代币圈的meme币，从对灵魂的担忧、到对财富的渴望，都是人性的一部分

1 周前

王冠雄频道 · 【未来汽车专栏】全国雾霾一片红，对泛汽车产业意味什么机会？

8 年前

迷彩虎 · 日本航母的野望 F35B竟是一个大“坑”

8 年前

科学解码 · 韩国欲研制时速达998公里超快火车？

8 年前

妈妈帮 · 坐完月子，我们就离婚！

7 年前

gogoboi · 一个白富美｜是怎样把全世界翻她的白眼都翻回去的

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!