各位读者,新年快乐!
2024年已经过去,人工智能技术突破了所有人的想象力极限。
在24 年初,“
是否有其他模型能在年内达到GPT-4水平
”还是个很大的问号。而现在,这显然已不再是个能吸引人们关注的话题。
Hugging Face的技术负责人Philipp Schmid回顾道:
这一年的进展令人难以置信,从开源模型到合成数据的应用,AI领域每个月都在发生革命性的突破
。
巨头的较量
先来回顾下全球范围内的巨头们。
OpenAI
依然是行业领头羊,正朝着「下一个Google」的方向狂奔。
打响大模型第一枪的OpenAI 显然当属第一天团,在toB、toC、模型能力、多模态、人才密度上都可称得上稳居第一。
其核心逻辑是「
计算架构+信息分发
」,试图打造一个
任务引擎、任务容器
。
刚刚发布的o1,o3 模型似乎表示出其兴趣正逐渐往o 系列转移。
或许,其内部已经实现AGI,但因资源或监管等因素,目前甚至将来,都将只是少数人才能用得上的
高级武器
。
同时,OpenAI 与微软的关系却似乎出现了微妙变化,有传言称「
微软可能会投资Anthropic
」,以增加对OpenAI 相关不确定性的抗衡。
Anthropic
表现抢眼。
在Coding领域深耕,专注Agent方向,正在打造一个完整生态系统。
核心竞争力在于「
端到端垂直整合能力
」,从成本优化到模型架构,一条龙全包。
主攻逻辑和AGI,没看到多模态的太多工作,至少没有对外展示太多。
xAI
虽然动作不大,但马斯克和x 平台数据的加持下,可以说是「
注定要成功,只是上限有待观察
」。
再结合马斯克的特斯拉、FSD、Optimus,甚至SpaceX,可谓
最大格局,最具想象力。
Meta
表现也算得上可圈可点。
Llama 3
展现出了比前代提升约10%的性能,并在整个Hugging Face生态系统中得到广泛应用,且
达到了GPT-4 级的能力。
4月发布的Llama 3 展示了在文本生成和总结方面的出色表现,随后在9月又推出了
Llama 3.2 Vision
——一个能够同时理解文本和图像的多模态模型。
占稳了开源生态的话语权,要做AI 界的Linux,这是
Meta 在AI 布局中最重要也最成功的一环。
同时还具备与智能眼镜、元宇宙等概念结合的实践和想象力,或许未来有望能一挑大哥苹果。
挑占马斯克,就还是算了吧,至今连架都还没打。
Perplexity
定位更像是一个
信息处理的Agent
。
其他,
Cursor
和
Devin
则在Coding领域发力,特别是Devin,被认为是「
第一个真正意义上做长距离复杂任务的Agent
」。
只是发布之后似乎有些拉垮?我还没用上过。
曾经名躁一时的
Mistral
似乎有了新的战略调整,据说「
已经正式放弃预训练
」。
中国势力的崛起
再来看看国内的模型厂商们。
字节跳动
除了豆包,Coze,还有一众人才、模型和资源,可以说是展现出了最强的决心,听闻不少数倍薪水被挖走的人才,投入和决心之大,在国内可以称是
举国无双
。
Deepseek
表现堪称今年最大黑马,其开源模型超越了GPT-4o和Sonnet,成为新的SOTA标杆。TheLMWa 称赞说:
「
Deepseek的表现令人惊叹
」。
千问
在开源生态方面表现出色,影响力持续扩大。
智谱
我没有使用太多,但感受上,是一家踏实做事的公司,口碑似乎不错,有不少人认可。
百度
似乎将重心转向了应用落地?
原因?
不祥。
腾讯
像是采取了相对保守的策略——「有大模型即可,不必争第一」。
也争不了。
快手
主要在于推出了可灵,在逻辑和娱乐之间,坚定地选择了后者,基因上似乎也只能这么选。
至于
Kimi
,应用和广告可能做得还行?以及除了公关上之外,似乎还需要在技术上有更多突破。
还有
百川
?最近没关注太多了。
其他,我还有漏了谁吗?
模型能力大爆发
o1系列
证明了LLM具备了推理能力,
Sonnet
在代码领域展现出惊人实力。
图像生成领域,
Grok
和
Flux
的作品已经几乎可以以假乱真。
视频生成更是突飞猛进,
Veo 2
能够生成超逼真的视频,而
Hailuo
、
Kling
和
Sora
也在紧随其后。
开源领域的
Deepseek
模型一鸣惊人,超越了GPT-4o和Sonnet,成为新的SOTA标杆。
TheLMWay 对这个中国模型大加称赞:
Deepseek的表现令人惊叹
。
summitbytes 分析道:
即使从今天起AI不再有任何进展,AGI所需的所有拼图也已经在这里了。从o3这样的推理模型,到Claude这样的写作模型,再到4o这样的语音和图像识别,以及特斯拉FSD这样的机器人/物理模型,最后是一个知道该在什么时候使用哪个模型的强化学习模型
。
AI助手全面升级
今年最显著的变化是
AI助手的能力全面提升
:
-
电脑代理
(Computer agents)能够在我们的电脑上执行各种任务
-
-
非技术人员也能轻松创建RAG聊天机器人和简单的AI代理
Omar Samir感叹道:「
2024年是AI的重大胜利!LLM的升级、Sonnet的编码奇迹,以及Veo 2的逼真视频,看到这些进展实在太酷了!
」
机器人和自动驾驶的飞跃
机器人领域的进展令人瞩目。
Renita Jade对此充满期待:「
我很高兴看到AI取得如此大的进展,实用的人形机器人是我一直最想看到的东西
」。
各种人形机器人原型的出现预示着,
大规模商用人形机器人可能在5年内成为现实
。
汽车公司小鹏甚至放弃了自动驾驶,转攻人形机器人方向。