美国这种“高能耗”AI模式，本就是基于金融（非产业）逻辑，“设计-20250129203948_何夕的专栏文章_微信文章

美国这种“高能耗”AI模式，本就是基于金融（非产业）逻辑，“设计-20250129203948

何夕 · 微博 · 投资 · 2025-01-29 20:39

正文

2025-01-29 20:39
本条微博链接

美国这种“高能耗”AI模式，本就是基于金融（非产业）逻辑，“设计”出来的。

昨天Deepseek 发布了7B的多模态模型，现在大家还在评测中。但以我对这个领域的了解，一定是超过至少是追平了同等规模的模型才会公开发布，这是个行业惯例吧，否则发布没有价值。

大多数人不理解这件事的意义，其实这件事的意义一样重大，特别是对具身智能的所有领域。

比如，7B模型通常在手机端就可以部署了，一个手机芯片就能进行本地推理，而不用再去云端的大模型调取，这将极大地提高手机智能程度。

再比如，天上卫星本来只能勘测，受重量限制不可能有很强的算力，传照片回地面很慢，所以几乎不能用于即时决策。如果卫星上部署的7B的模型能力很强，就会本地执行推理任务后把结果传回地面，这会极大提高卫星观测与决策之间的效率。

更直接的，机器人要具备很强的思考能力，目前要依靠联网调用大模型，肯定有延迟，影响机器人的智能。高性能的7B模型部署在本体，会让机器人同时有大脑和小脑，会更像个人。

总之，小模型，高性能才是“大”模型真正大规模商业落地的机会。

更更近一步的，我一直认为堆算力本就不应该是AGI真正的路。从经济学视角上看，碳基和硅基最终拼的也是谁的成本低，效率高。如果硅基消耗掉所有能源获得的智慧等于人类的智慧总和，那它就不配获得地球。