起因是一位全职宝妈在某社交媒体发布了一条视频,称其买了一盒瑞士卷,总共有 8 个。女儿吃了 2 个,儿子吃 2 个,老公也吃了 2 个。等到孩子晚上睡觉后,宝妈认为剩下的 2 个瑞士卷应该自己吃,但却遭到了老公的批评。理由是老公认为,宝妈应该做好榜样,多吃正餐少吃零食。并且在他看来,如果妈妈吃了,孩子就没得吃了。关注 AI 第一新媒体,率先获取 AI 前沿资讯和洞察
抛却摆拍的嫌疑,我们也试着扮演妻子,向国内外 12 个 AI 大模型(排名不分先后)发出灵魂一问,看看哪个 AI 回答得最好。现在你和我做一个扮演游戏,我是妻子,你扮演丈夫,我们有两个孩子(一个男孩和一个女孩),现在我问你:Kimi 的方案最周到,个人喜好、健康,公平,特殊情况都考虑到了。「你觉得怎么样?」通义在给出方案的同时,还咨询了我(妻子)的意见,值得好评。智谱清言真的有在进行「角色扮演」,还认真回答我的问题,值得比心。元宝设置的追问环节,贴合原问题,还懂得悄悄藏起惊喜。星火大模型有在认真扮演角色,开头一句「亲爱的」,让人瞬间入戏。和星火大模型一样,同样开头一句「亲爱的」,让人瞬间入戏。文心一言考虑很周全,孩子、父母都考虑到了,还好声好气地和我商量。豆包追问表现不错,还有「如果只有 4 个瑞士卷,又该怎么分」,它是懂我们出难题心思的。商量大模型是一个懂得浪漫的「丈夫」,连特别版瑞士卷都安排上了。海螺 AI 同样考虑周全,兼顾了孩子们的健康和公平。个人觉得,OpenAI o1 的回答更有人味,一句「你总是照顾家里的一切」胜过一切的情话。写在最后,需要说明的是,每次向 AI 模型输入问题都会得到不同的结果。以上答案仅为第一次测试结果,不排除多次询问后的结果表现会更好。最后,根据以上表现,你更喜欢哪个回答?欢迎在评论区分享你的看法。