本文介绍了李开复对于国内基座大模型的判断,认为未来可能只剩下DeepSeek、阿里巴巴、字节跳动三家。文章阐述了李开复的观点以及背后的原因,包括他对DeepSeek的看好,对阿里巴巴和字节跳动在技术实力和流量优势上的认可。同时,文章也提到了大模型市场的现状以及AI厂商面临的挑战。
李开复基于技术实力和流量优势做出此判断,DeepSeek具备开源优势,阿里巴巴在AI开发者社区有盛誉,字节跳动拥有抖音这一海量用户平台。
当前大模型市场经历了“百模大战”的阶段,现在面临资本撤离、巨头竞争、训练成本高等问题。同时,开源与闭源的选择也成为厂商面临的重要问题。
开源模型如DeepSeek的大模型成为新的行业标杆,引发基座大模型的价值重估。开源路线有助于降低成本和实现更广泛的应用落地。
国内的基座大模型大概率将会只剩下DeepSeek、阿里巴巴、字节跳动三家,这是创新工场董事长李开复近日在接受彭博社采访时做出的判断。
在人工智能走红后,李开复与周鸿祎、李彦宏等人一道,成为了国内互联网行业中经常对其评头论足的大佬。那么这一次他关于未来国内大模型市场将从群雄逐鹿的“百模大战”发展至只剩下DeepSeek、阿里巴巴、字节跳动的三足鼎立,到底是无稽之谈、还是不可避免呢?
事实上,李开复对于这番论断极有可能是很有信心的,如若不然,他领导的零一万物也不会成为全面拥抱DeepSeek旗下大模型的第一个“AI六小虎”。早在今年年初,也就是DeeppSeek-R1尚未出圈时,李开复就已宣布零一万物未来不会再做万亿参数模型的预训练,而是将专注在务实的、小而快的、能够以商业性价比来评估的模型。
其实不仅仅是零一万物,在大名鼎鼎的“AI六小虎”里,除了得到一众资方支持的智谱,已经有四家在大模型的迭代这件事上都按下了暂停键。至于在“AI六小虎”之外的其他中小规模AI厂商,现在在大模型这件事也几乎都已经没有了声响。从某种意义上来说,在2023年如火如荼的“百模大战”反而是个特殊现象。
此前在2023年春季,国内AI赛道的“百模大战”之所以会迅速成型,盖因苦于缺乏标的的投资机构终于有了一个看起来无比光明的赛道可以押注,蜂拥而至的资本正是“百模大战”的导火索。彼时,狂飙突进十余年的互联网行业投资踩下急刹车,大消费赛道业已经偃旗息鼓,以至于国内投资圈流传出了这样一句话,“现在没啥好项目,凡是能跑出来的东西早被投完了。”
这时候ChatGPT的出现就给市场注入了强心剂,投资机构则期盼AI能够成为下一个互联网。当ChatGPT的开发商OpenAI在做大语言模型(LLM)的情况下,擅长Copy To China的部分国内企业自然有样学样,搞起了那时候时髦的大模型。
只可惜AI大模型与互联网虽然同属于广义上的科技,但两者的底层逻辑完全不同,互联网是轻资产的代表,而大模型却是技术与资本双密集。大模型的训练不仅是个技术活,需要有懂芯片、推理、模型、算法的人才,还有资源密集型的特征,要耗费海量的电力、冷却水,以及算力。
以Meta的LLama3为例,其8B和70B模型的训练就累积耗费了770万个GPU训练时长(GPU Hours),用的是英伟达的H100-80GB显卡,按照AWS上12美元/机时的价格来算,这一训练的花费高达9240万美元。也难怪从2024年开始,一级市场的投资者开始对大模型望而却步,就正是因为训练大模型其实是巨头才能玩得转的游戏。
更加致命的是,这些巨头还不太讲武德,在2024年初夏搞起了价格战,使得资源有限的中小厂商只能作壁上观。到了2025年年初,DeepSeek凭借高效低成本的优势一举成为AI行业的新标杆,而更让一众AI厂商若坐针毡的是,DeepSeek的大模型还是开源的。