突发！大模型一夜易主，终结GPT-4最强的时代！

AI小岛 · 公众号 · · 2024-03-05 10:45

正文

AI领域，大模型的竞争变得越来越激烈。

可正当我们以为GPT-4是行业的巅峰时，一个令人兴奋的消息震动整个行业：Anthropic宣布推出Claude 3。

这不仅仅是一次升级，它几乎是在告诉我们： GPT-4的时代可能正在结束，而Claude 3正是那个终结者，它甚至已经开始瞄准GPT-5。

Claude 3的亮相

首先，让我们来深入了解Claude 3模型，它由三个顶尖的模型组成：Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。并且在推理、数学、编程、多语言理解和视觉等方面树立新的行业标准。

想象一下，你手里的智能手机突然变得更聪明了，这就是Claude 3 Opus的魔力——它在各项评估中超越了GPT-4和Gemini Ultra，成为最强大的模型。

但这不仅仅是关于智能的提升。想象你正在为一个项目选择工具，你会考虑它的智能、速度和成本。好消息是，Claude 3让这一切变得可能。

Opus是我们最具智慧的模型，几乎达到了人类理解的水平，能够灵活处理开放式提示，应对复杂任务。而Haiku则是市面上最快、最经济的模型，考虑到其智能水平，简直是性价比之王。

如果你想要速度，Sonnet是你的最佳选择，它比Claude 2和Claude 2.1快上两倍，而Opus的速度与以往模型相当。

Claude 3还在视觉能力上与其他领先模型不相上下，处理各种视觉格式，如照片、图表、图形和技术图纸，都不在话下。

每个模型在分析和预测、微妙的内容创作、代码生成、以及用非英语语言（如西班牙语、日语和法语）进行对话方面的能力都有所增强。

而且，这次在改进Claude模型时，特别注意到以前模型经常做出不必要拒绝的问题。现在，Claude 3模型在处理接近系统警戒线的提示时，拒绝的可能性大大降低。

虽然Claude 3在生物知识、网络相关知识和自主性方面相比以前的模型有所进步，但它仍然遵循我们的负责任扩展政策，保持在AI安全级别2（ASL-2）。

Opus和Sonnet已经可以通过我们的API使用，这意味着开发者可以立即开始利用这些模型来创造。 Sonnet这款模型目前可以免费体验，而Opus则为Claude Pro的订阅者提供服务。

这次发布，用户可以根据自己的使用场景，选择最理想的智能、速度和成本组合。

令人印象深刻的更新

特别是，他们引入的领域专家基准。相比于那些已经饱和的MMLU和HumanEval测试，Claude选择金融、医学和哲学这些专业领域，并报告性能表现。这一举措值得所有大型语言模型(LM)的模型卡片跟进，这样不同的下游应用就知道可以期待什么了。

还有就是，拒绝率分析也是一个亮点。对于无辜问题过于谨慎的回答，已经成为一种普遍现象。 Anthropic通常在安全性上保持极端谨慎，但他们认识到了这个问题，并突出显示他们在这方面的努力。真是太好了！

另外，我对Claude 3的定价特别感兴趣——看起来，他们真的在价格上给OpenAI的GPT-4和GPT-3.5带来了不小的压力。这不仅仅是一场价格战，更像是在向市场宣告，高性能的人工智能服务不需要高昂的价格。

这种策略可能会彻底改变游戏规则，吸引更多的开发者和企业选择Claude 3作为他们的AI合作伙伴。

随着Claude 3的激动人心的推出，我们站在人工智能发展的新起点。

Anthropic通过引入Claude 3 Opus、Sonnet和Haiku，不仅挑战现有的AI巨头，更为整个行业树立新的标准。

让我们拭目以待，看看Claude 3将如何在这场科技革命中，绘制出它独特的光彩。

- End -

往期推荐

Elon Musk起诉OpenAI：Q*模型，AGI的朋友还是人类的敌人？

自GPT问世以来，哪些工作岗位受影响最大？

这个超级Prompt能让GPT秒变为真实的资深营销专家？

Genie：用一张草图开启无限游戏世界的大门！

爆料！GPT即将迎来一些更新！

Mistral登场，挑战GPT-4霸主地位的AI新势力！