专栏名称: 飞总聊IT

飞总，从事大数据的基础构架研发10余年。本公众号的主要目的是和大家交流我在大数据基础架构，IT前沿发展，职场经验的方面的观点和看法。本公众号仅代表本人的观点，不代表公司观点。

史上最强开源大模型 Llama 3正式发布。。。

飞总聊IT · 公众号 · · 2024-04-19 07:03

正文

关注飞总聊IT，了解IT行业的方方面面。

Meta宣布，Llama3的80亿和700亿参数版本发布了。

这款开源的大模型是真的牛逼了。

根据Meta的数据，小一点的8B模型，在MMUL,GPQA,HumanEval等一系列测试中，都超过了Gemma7B和Mistral 7B。

而更牛逼的70B模型，则可以和Claude 3 Sonnet以及谷歌的Gemini Pro 1.5 PK，毫无毛病。

Meta还有一个没开源的400B的，在training中。据说这个400B的更牛逼，和Claude 3 Opus也能干起来，干翻GPT 3.5也是不在话下。至于GPT 4的话，可能还有点距离。

据说训练Llama 3的数据规模达到了15T的token，比之前的版本多了7倍。这就让Llama 3显得尤其牛逼了。

当然，Llama 3 也不是没缺点，上下文窗口长度目前只有8k。不过我估计这也不是什么问题，在Meta的加持下，只是时间问题。

为了训练这个模型，Meta用了两套的24k H100。这是真的有点土豪了。不得不说Meta实在是有钱买显卡啊。一般的公司大概率是不敢这么豪横的。

当然，对于中文社区来说，肯定还是有点遗憾。这个模型的语料里面5%的是非英文，其他的都是英文和代码。总体来说，Llama的中文表现并不是很理想。

总体来说，Meta砸了重金，训练了一个特别牛逼的模型，开源了，可谓土豪菩萨，撒钱贡献开源毫不含糊。

所以在今天股票市场一片大跌的前提下，Meta的股票竟然逆势涨了起来。一度涨幅高达3%。

我们可以这样说，OpenAI是个假的Open，真的OpenAI来自Meta。只有Meta才是新时代大语言模型的活菩萨活雷锋。

小札自从元宇宙搞失败以后，是彻底转型成为AI大语言模型领军人物了。难怪Meta的股价在跌破100以后能如此迅速回到500以上。

我又要讲个鬼故事了。前段时间，Databricks宣布了它家的开源模型DBRX跑分跑了第一。据说训练花了1000万美元。

这个模型还没让Databricks高兴多久，Llama 3这种逆天的大模型就出来了，不知道1000万美元和2套24k的H100比起来，到底算啥呢？

Databricks是不是应该砸3套24k的H100，训练一个DBRX3.0出来，拳打Llama 3，脚踢GPT 4？

推荐文章

中工国际 · 媒体关注｜冰雪经济催生新机遇北起院索道引领行业新高度

11 小时前

普象工业设计小站 · 牛逼！就因为它，已经看不上2000元的飞*浦了！

2 天前

中国城市规划 · 天下事 | 各地相继召开“新春第一会”，有什么动向

4 天前

中国城市规划 · 新春征集 | 紧急呼叫旧城改造特种兵！您的拖延症正在破坏古建风水！

4 天前

创意铺子 · 春晚收视出炉！排名第一节目太意外，网友：文化盛宴

3 天前

风青杨 · 为什么中国的大学宿舍环境比美国一百年前还要差？

8 年前

游戏陀螺 · H5游戏《小小战争》个案：做出千万流水产品？被逼无奈！

8 年前

爱手工 · 今晚，古筝入门第三章直播课：古筝基础指法的运用弹奏与新指法（中指、大撮）学习

7 年前

军事纵横 · 鼻炎总犯，怎么办？看看网友们都用什么妙招（管用）

7 年前

itslearning · 黑龙江工商学院经济系 | 第十一届田径运动会

7 年前