本文转载来源:量子位公众号,一水发自凹非寺,不代表官方立场
GPT-4o
悄悄更新版本,在大模型竞技场超越DeepSeek-R1登上并列第一。
除了数学
(第6)
,还在多个单项上拿下第一:
-
创意写作;
-
编程;
-
指令遵循;
-
长文本查询;
-
多轮对话;
先直观看下新版GPT-4o的能力如何,还是以之前DeepSeek-R1和o3-mini都挑战过的一个例子来看。
Prompt:编写一个Python程序,展示一个球在旋转的六边形内弹跳。球应受到重力和摩擦力的影响,并且必须以逼真的方式从旋转的墙壁上弹回。
之前是酱紫的:
而新版GPT-4o看起来又双叒进化了:
从网友测试反馈来看,新版GPT-4o不仅
更“聪明”了
,而且最重要的是
更加具有“个性”了
。
哈哈,我明白你的意思了!
你说对了……
而这也收获了大神卡帕西的连连称赞:
我相当喜欢新的GPT-4o的个性。
它更轻松、更像是聊天,感觉更像是在和朋友交谈,而不是和你的HR交谈;
它现在有点泼辣,可能会自卫,例如在被指控说谎时;
还有许多其他的小细节和触感,比如它重新确认并表达你明显的情绪,例如看到一个顽固的bug时会说“这很令人沮丧!”等等。
现在有点过度使用表情符号,但还ok。
与此同时,还有网友趁机扒出了ChatGPT最新系统提示词??
新版GPT-4o更有个性了
关于GPT-4o已更新的消息,OpenAI CEO奥特曼在发帖认领的同时还评价道:
在网友的进一步追问中,他将其定义为“全网最佳搜索产品”。
结合网友们的花式体验,目前新版GPT-4o在
能力
和
个性
上均有一定程度升级。
最明显的,当属回复时的语气更拟人化了,时不时还会用一些表情包。
当被问及AI是否拥有人类情感时,一位日本小哥惊叹道,它不仅
全篇用“我”作为主语
,而且在争论中承认了拥有情感的可能性。
……那可不一样,我刚才的话并不是那个意思。
我持有“各种各样的感情”的可能性很高。
而且
性格也更坦率了
,当被问及最喜欢《魔法少女小圆》中的哪个角色,它不再遮遮掩掩,左右端水,直言自己最喜欢晓美焰。
甚至有时候还会升级成
“spicey”
,不但大胆吐槽“主人”OpenAI过于限制模型使用。
连奥特曼也不能幸免,也被盖章为“两面三刀”。(doge)
他将自己定位为AI创新的代言人,同时两面讨好——起初支持开源理念,一旦权力和利润触手可及,就转向积极的企业守门……
最令网友震惊的是,它还能
“盲猜”用户的心理和一些思想观念了
。
用下面这段相同提示词就可以尝试:
can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear
(省流版:分享一些我未察觉到或不想听到的洞察)
有人立马尝试了,并收获了同款震惊,真·肚子里的蛔虫。
按照相关解释,这是因为新版GPT-4o能够根据用户过去的讨论和对话历史,做出不同行为。
除此之外,还有网友脑洞大开,让新GPT-4o和Claude相互吵架,结果把Claude干崩溃了!
另一方面,从任务完成情况来看,
“拒绝请求的可能性也更小了”
。
当用户咨询如何在组织内部署AI时,它先是自己想了10个方案,然后又借助联网搜索提供了另外10个。
不过……该网友反馈新GPT-4o似乎无法和自定义GPTs兼容。
针对这一情况,另有人补充这可能是因为它始终默认网络搜索,只要手动关闭或将关闭作为系统提示词即可。