美国这种“高能耗”AI模式,本就是基于金融(非产业)逻辑,“设计”出来的。
昨天Deepseek 发布了7B的多模态模型,现在大家还在评测中。但以我对这个领域的了解,一定是超过至少是追平了同等规模的模型才会公开发布,这是个行业惯例吧,否则发布没有价值。
大多数人不理解这件事的意义,其实这件事的意义一样重大,特别是对具身智能的所有领域。
比如,7B模型通常在手机端就可以部署了,一个手机芯片就能进行本地推理,而不用再去云端的大模型调取,这将极大地提高手机智能程度。
再比如,天上卫星本来只能勘测,受重量限制不可能有很强的算力,传照片回地面很慢,所以几乎不能用于即时决策。如果卫星上部署的7B的模型能力很强,就会本地执行推理任务后把结果传回地面,这会极大提高卫星观测与决策之间的效率。
更直接的,机器人要具备很强的思考能力,目前要依靠联网调用大模型,肯定有延迟,影响机器人的智能。高性能的7B模型部署在本体,会让机器人同时有大脑和小脑,会更像个人。
总之,小模型,高性能才是“大”模型真正大规模商业落地的机会。
更更近一步的,我一直认为堆算力本就不应该是AGI真正的路。从经济学视角上看,碳基和硅基最终拼的也是谁的成本低,效率高。如果硅基消耗掉所有能源获得的智慧等于人类的智慧总和,那它就不配获得地球。
大多数人不理解这件事的意义,其实这件事的意义一样重大,特别是对具身智能的所有领域。
比如,7B模型通常在手机端就可以部署了,一个手机芯片就能进行本地推理,而不用再去云端的大模型调取,这将极大地提高手机智能程度。
再比如,天上卫星本来只能勘测,受重量限制不可能有很强的算力,传照片回地面很慢,所以几乎不能用于即时决策。如果卫星上部署的7B的模型能力很强,就会本地执行推理任务后把结果传回地面,这会极大提高卫星观测与决策之间的效率。
更直接的,机器人要具备很强的思考能力,目前要依靠联网调用大模型,肯定有延迟,影响机器人的智能。高性能的7B模型部署在本体,会让机器人同时有大脑和小脑,会更像个人。
总之,小模型,高性能才是“大”模型真正大规模商业落地的机会。
更更近一步的,我一直认为堆算力本就不应该是AGI真正的路。从经济学视角上看,碳基和硅基最终拼的也是谁的成本低,效率高。如果硅基消耗掉所有能源获得的智慧等于人类的智慧总和,那它就不配获得地球。