真这样就是“数据投毒”了,推理过程一致性对模型可信度很重要,刻意混淆会直接影响模型的实际应用价值。
试了一下OpenAI刚放出来的o3-mini,见图。是一个大模型经常容易犯错误的例子,o3-mini答对了,但奇怪的是,它的最终答案虽然正确,但给出的推理过程错误百出,且不说它的推理过程没有用中文,内容也是很奇怪,比如我的问题问的是小明,它的推理过程中却说是Xiaohong,题目中说是两个哥哥三个妹妹,推理过程却说three elder systers and two younger brothers,完全乱套。严重怀疑o3-mini的推理过程不是模型原始的推理过程,而是用另一个不靠谱的模型改写后的,可能还是怕别人用它的数据来蒸馏吧,跟DeepSeek比起来,真是太小心眼了。