专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
目录
相关文章推荐
爱可可-爱生活  ·  【LLMs4TS:时间序列预测的人工智能研究 ... ·  3 天前  
爱可可-爱生活  ·  【lew-ui:基于Vue3的精美组件库,提 ... ·  3 天前  
黄建同学  ·  Cursor,Copilot等AI编程工具彻 ... ·  3 天前  
51好读  ›  专栏  ›  宝玉xp

回复@小柜子91981:不排除这种可能//@小柜子91981:有-20240914120111

宝玉xp  · 微博  · AI  · 2024-09-14 12:01

正文

2024-09-14 12:01

回复@小柜子91981:不排除这种可能//@小柜子91981:有没可能都训练过?
我用 o1 Preview 测试2024年高考新课标一卷数学的前8道单选题,猜猜对了多少?

第一步,先借助 Gemini 帮我把试卷中的数学公式转成 Latex,本来我是想好好夸一下 Gemini 的 OCR 做的好的,结果发现有 3 道题识别错了!所以以后用 Gemini 做 OCR,得注意校对,但还是能节约很多工作。

第一次尝试8题一起发给 o1 preview,但是只做了第8题,不过第8题推导过程和结果是对的

第 8 题 ✅

接下来一道一道发给 o1 preview:
第 1 题 ✅ 10s
第 2 题 ✅ 7s
第 3 题 ✅ 12s
第 4 题 ✅ 10s
第 5 题 ✅ 6s
第 6 题 ✅ 14s
第 7 题 ✅ 51s

也就是第一道单选题8题全对。

其他题目我没有测试,但是有网友测试过完整的(x.com/howie_serious/status/1834486762623938588),据其说是全对,而且有些还是用的 o1 mini。

#OpenAI发布最强模型o1#