专栏名称: 巴比特资讯
区块链/数字货币/比特币中文资讯,创立于2011年,200多位专栏作入驻平台,国内最大区块链资讯原创基地(公众号【原创】认证),我们为以下合作伙伴供稿:火币、OKCoin、BTC.com、BTCC、币看、BTC123、比特时代、挖币网
目录
相关文章推荐
巴比特资讯  ·  AI助力短剧,技术、艺术踏入同一条河流 ·  14 小时前  
巴比特资讯  ·  被迫转型后,9人团队把AI写作做到500万美 ... ·  昨天  
闪电HSL  ·  将国债代币化,并在 Uniswap ... ·  2 天前  
巴比特资讯  ·  ChatGPT的一个微小更新,让整个APP更实用了 ·  6 天前  
巴比特资讯  ·  15亿流量,为何没带来AI游戏的『王者荣耀 』 ·  1 周前  
51好读  ›  专栏  ›  巴比特资讯

o1满血版泄露!奥数题图片推理手拿把掐,奥特曼上线剧透o2

巴比特资讯  · 公众号  · 比特币  · 2024-11-04 17:47

正文

图片来源:由无界AI生成


本文来源:量子位


o1满血版泄露了!


没想到,OpenAI还搁那儿“今年一定”呢,不少网友已经率先上手体验到了(doge)。


事情是酱婶的:有网友发现,OpenAI已经在ChatGPT官网上部署了完整版o1,大家伙儿还都能卡bug直接用!



最初发现此事的网友,测试确认泄露模型具有奥特曼所说的图像推理能力。


△图源:𝕏@legit_rumors


而日志也显示该模型就是o1本模。



于是,赶在OpenAI出手修复之前,网友们抓紧大玩特玩了一波——


满血o1到底有多牛


和已经发布的o1-preview、o1-mini最直观的不同是,泄露出来的o1支持上传附件。


这也就意味着,终于能测测o1的多模态能力了。


网友们也不说废话,直接上强度,普特南数学竞赛的证明题截图一贴,甩给满血o1。


对正整数n,有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n,使得|fn‘’(0)|>2023。



思考了18秒之后,o1给出答案:18。



答案正确:



再来一道更复杂的,虽然在识图上遇到了一点小问题,但还是稳稳做对了。




在如此惊艳表现之下,似乎正确识别人类史上首张黑洞照片也不算什么了(doge)。



不过嘛,也不是没有翻车案例。比如,让大模型数数图里有多少个三角形。



ID为anagh的𝕏网友,给泄露模型和GPT-4o做了个同屏对比:



4o速度很快,给出了错误答案19。


而满血o1花了1分39秒,狂刷一堆token……给出了不同的错误答案:29。


正确答案是24。



这个bug现在已经修复了。不过,有意思的是,这次模型泄露,持续了整整3个小时。


不小心还是故意的?


有网友犀利地点出,这事儿看上去不是“不小心”,而是“精心策划”:


目的是让人们对即将发布的模型有一个预期。



不少网友赞同这样的观点:


奥特曼的目的是测试和炒作。



而由于一切看上去已经部署就绪,甚至有人猜测,o1完整版的正式上线时间就在未来一周之内。



值得注意的是,就在这次泄露事件之后,奥特曼马上在𝕏上开始了自己的表演:



好家伙,都已经吹上o2的风了(还假装上错号……)。



至于为什么是这个时间……


那不得赶在Anthropic发布Claude Haiku 3.5之前搞点事嘛(doge)。






中国AIGC产业应用峰会回顾

2024 年 1 月 5 日,【智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会】在杭州未来科技城会议中心举行。


大会汇集行业资深专家及领军企业,共同聚焦AIGC领域,围绕当下热点话题进行深度延展,探讨行业激烈竞争下的运营新思路、发展新模式!点击文章,回顾精彩内容~










AI新智界园区开放合作啦!