OpenAI本来是最早发现RL涌现思考能力的公司,但它是闭源的,DeepSeek 在3个月左右就发现类似的方法并开源了出来,因此这个突破性工作荣誉理应属于DeepSeek,同样也属于开源界,而不是闭源的OpenAI。
DeepSeek的RL工作让大家看到了AI思考能力涌现的路径,o1出现之前大家还觉得大模型是个只会通过记忆压缩预测下一个字的呆子,现在RL给大模型插上思考的翅膀之后,AGI又往前迈了一大步,DeepSeek的开源可以毫不夸张的说就是凭一己之力将开源跟闭源的差距缩短了到半年
#DeepSeek使行业质疑千亿美元支出效用#
DeepSeek的RL工作让大家看到了AI思考能力涌现的路径,o1出现之前大家还觉得大模型是个只会通过记忆压缩预测下一个字的呆子,现在RL给大模型插上思考的翅膀之后,AGI又往前迈了一大步,DeepSeek的开源可以毫不夸张的说就是凭一己之力将开源跟闭源的差距缩短了到半年
#DeepSeek使行业质疑千亿美元支出效用#