专栏名称: AGI Hunt
关注AGI 的沿途风景!
目录
相关文章推荐
哔哩哔哩  ·  纪录片首曝,《哪吒2》的幕后秘密 ·  17 小时前  
哔哩哔哩  ·  如何应对“致命”流感? ·  17 小时前  
哔哩哔哩  ·  全网1亿粉丝的毒舌大神,来B站了! ·  17 小时前  
安徽省发展改革委  ·  安徽省新能源汽车产业集群建设企业巡展——【2 ... ·  昨天  
安徽省发展改革委  ·  安徽省新能源汽车产业集群建设企业巡展——【2 ... ·  昨天  
51好读  ›  专栏  ›  AGI Hunt

2024 盘点——AI大爆发之年,我们正生活在奇点时代!

AGI Hunt  · 公众号  ·  · 2025-01-01 00:23

正文

各位读者,新年快乐!

2024年已经过去,人工智能技术突破了所有人的想象力极限。

在24 年初,“ 是否有其他模型能在年内达到GPT-4水平 ”还是个很大的问号。而现在,这显然已不再是个能吸引人们关注的话题。

Hugging Face的技术负责人Philipp Schmid回顾道:

这一年的进展令人难以置信,从开源模型到合成数据的应用,AI领域每个月都在发生革命性的突破

巨头的较量


先来回顾下全球范围内的巨头们。

OpenAI

依然是行业领头羊,正朝着「下一个Google」的方向狂奔。

打响大模型第一枪的OpenAI 显然当属第一天团,在toB、toC、模型能力、多模态、人才密度上都可称得上稳居第一。

其核心逻辑是「 计算架构+信息分发 」,试图打造一个 任务引擎、任务容器

刚刚发布的o1,o3 模型似乎表示出其兴趣正逐渐往o 系列转移。

或许,其内部已经实现AGI,但因资源或监管等因素,目前甚至将来,都将只是少数人才能用得上的 高级武器

同时,OpenAI 与微软的关系却似乎出现了微妙变化,有传言称「 微软可能会投资Anthropic 」,以增加对OpenAI 相关不确定性的抗衡。

Anthropic

表现抢眼。

在Coding领域深耕,专注Agent方向,正在打造一个完整生态系统。

核心竞争力在于「 端到端垂直整合能力 」,从成本优化到模型架构,一条龙全包。

主攻逻辑和AGI,没看到多模态的太多工作,至少没有对外展示太多。

xAI

虽然动作不大,但马斯克和x 平台数据的加持下,可以说是「 注定要成功,只是上限有待观察 」。

再结合马斯克的特斯拉、FSD、Optimus,甚至SpaceX,可谓 最大格局,最具想象力。

Meta

表现也算得上可圈可点。

Llama 3 展现出了比前代提升约10%的性能,并在整个Hugging Face生态系统中得到广泛应用,且 达到了GPT-4 级的能力。

4月发布的Llama 3 展示了在文本生成和总结方面的出色表现,随后在9月又推出了 Llama 3.2 Vision ——一个能够同时理解文本和图像的多模态模型。

占稳了开源生态的话语权,要做AI 界的Linux,这是 Meta 在AI 布局中最重要也最成功的一环。

同时还具备与智能眼镜、元宇宙等概念结合的实践和想象力,或许未来有望能一挑大哥苹果。

挑占马斯克,就还是算了吧,至今连架都还没打。

Perplexity

定位更像是一个 信息处理的Agent

其他, Cursor Devin 则在Coding领域发力,特别是Devin,被认为是「 第一个真正意义上做长距离复杂任务的Agent 」。

只是发布之后似乎有些拉垮?我还没用上过。

曾经名躁一时的 Mistral 似乎有了新的战略调整,据说「 已经正式放弃预训练 」。

中国势力的崛起


再来看看国内的模型厂商们。

字节跳动

除了豆包,Coze,还有一众人才、模型和资源,可以说是展现出了最强的决心,听闻不少数倍薪水被挖走的人才,投入和决心之大,在国内可以称是 举国无双

Deepseek

表现堪称今年最大黑马,其开源模型超越了GPT-4o和Sonnet,成为新的SOTA标杆。TheLMWa 称赞说:

Deepseek的表现令人惊叹 」。

千问

在开源生态方面表现出色,影响力持续扩大。

智谱

我没有使用太多,但感受上,是一家踏实做事的公司,口碑似乎不错,有不少人认可。

百度

似乎将重心转向了应用落地?

原因?

不祥。

腾讯

像是采取了相对保守的策略——「有大模型即可,不必争第一」。

也争不了。

快手

主要在于推出了可灵,在逻辑和娱乐之间,坚定地选择了后者,基因上似乎也只能这么选。

至于 Kimi ,应用和广告可能做得还行?以及除了公关上之外,似乎还需要在技术上有更多突破。

还有 百川 ?最近没关注太多了。

其他,我还有漏了谁吗?

模型能力大爆发


o1系列 证明了LLM具备了推理能力, Sonnet 在代码领域展现出惊人实力。

图像生成领域, Grok Flux 的作品已经几乎可以以假乱真。

视频生成更是突飞猛进, Veo 2 能够生成超逼真的视频,而 Hailuo Kling Sora 也在紧随其后。

开源领域的 Deepseek 模型一鸣惊人,超越了GPT-4o和Sonnet,成为新的SOTA标杆。

TheLMWay 对这个中国模型大加称赞:

Deepseek的表现令人惊叹

summitbytes 分析道:

即使从今天起AI不再有任何进展,AGI所需的所有拼图也已经在这里了。从o3这样的推理模型,到Claude这样的写作模型,再到4o这样的语音和图像识别,以及特斯拉FSD这样的机器人/物理模型,最后是一个知道该在什么时候使用哪个模型的强化学习模型

AI助手全面升级


今年最显著的变化是 AI助手的能力全面提升

  • 电脑代理 (Computer agents)能够在我们的电脑上执行各种任务

  • AI编程助手的水平已经能与初级软件工程师媲美

  • 非技术人员也能轻松创建RAG聊天机器人和简单的AI代理

Omar Samir感叹道:「 2024年是AI的重大胜利!LLM的升级、Sonnet的编码奇迹,以及Veo 2的逼真视频,看到这些进展实在太酷了!

机器人和自动驾驶的飞跃


机器人领域的进展令人瞩目。

Renita Jade对此充满期待:「 我很高兴看到AI取得如此大的进展,实用的人形机器人是我一直最想看到的东西 」。

各种人形机器人原型的出现预示着, 大规模商用人形机器人可能在5年内成为现实

汽车公司小鹏甚至放弃了自动驾驶,转攻人形机器人方向。







请到「今天看啥」查看全文