转发微博
#模型时代# Deepseek的内部消息,V3发布不在计划内,下个版本会真正媲美GPT-4o。
X上Hyperbolic labs创始人Jasper披露了一些他得到的Deepseek情况,信息量不少,转译如下:
***
刚刚与deepseek_ai的伙计们聊过,这里有一些深层次的秘密:
V3 只是一个开始,他们计划在未来 3-6 个月内发布一个可与最新的 GPT 4o 模型相媲美甚至更好的新版本。
他们非常注重研究,从未在营销上投入任何资金。这次发布并不是计划好的:只是几天前模型达到了一定水平,所以他们决定发布它
他们相信人工智能模型的去中心化和民主化,并将继续开源新的人工智能模型
Deepseek 从来没有接受过任何风险投资。他们的资金来自一家名为 High-Flyer(幻方)的顶级对冲基金。
有趣的是:三年前,当我在 Citadel 工作时,他们的联合创始人希望我与他们合作(我没有这样做,因为我想建立自己的初创公司)。他告诉我,他们建立了一个数据中心,用于运行 ML 实验来预测市场并执行策略,但在交易时间之外,大多数 GPU 都处于闲置状态。看来他们现在找到了充分利用这些闲置 GPU 时间的好办法。
X上Hyperbolic labs创始人Jasper披露了一些他得到的Deepseek情况,信息量不少,转译如下:
***
刚刚与deepseek_ai的伙计们聊过,这里有一些深层次的秘密:
V3 只是一个开始,他们计划在未来 3-6 个月内发布一个可与最新的 GPT 4o 模型相媲美甚至更好的新版本。
他们非常注重研究,从未在营销上投入任何资金。这次发布并不是计划好的:只是几天前模型达到了一定水平,所以他们决定发布它
他们相信人工智能模型的去中心化和民主化,并将继续开源新的人工智能模型
Deepseek 从来没有接受过任何风险投资。他们的资金来自一家名为 High-Flyer(幻方)的顶级对冲基金。
有趣的是:三年前,当我在 Citadel 工作时,他们的联合创始人希望我与他们合作(我没有这样做,因为我想建立自己的初创公司)。他告诉我,他们建立了一个数据中心,用于运行 ML 实验来预测市场并执行策略,但在交易时间之外,大多数 GPU 都处于闲置状态。看来他们现在找到了充分利用这些闲置 GPU 时间的好办法。