专栏名称: 歸藏的AI工具箱

互联网科技博主产品设计师、模型设计师、不会代码的独立开发者。关注人工智能、LLM 、 Stable Diffusion 和设计。

目录

相关文章推荐

蛋先生工作室 · 2025年2月25日最新蛋价（上午） · 昨天

江南都市报 · 即日起正式启动！全省有奖公开征集！ · 昨天

潮司电商客服外包 · 拼多多抢抖音商家？平台的反击战还是来了 · 2 天前

电子商务研究中心 · A股IPO败北后 ... · 2 天前

玺承电商观察 · 从CORE新流量机制到付费投流，多维度教你在 ... · 4 天前

玺承电商观察 · 从CORE新流量机制到付费投流，多维度教你在 ... · 4 天前

51好读 › 专栏 › 歸藏的AI工具箱

Cerebras 也来抢 Groq 的生意了，推出世界上最快的 -20240828154327

歸藏的AI工具箱 · 微博 · · 2024-08-28 15:43

正文

2024-08-28 15:43
本条微博链接

Cerebras 也来抢 Groq 的生意了，推出世界上最快的 LLM 推理服务。 #ai#

Llama 3.1 8B 的生成数独可以到每秒1800Token，70B 可以达到 450 Token。

且价格更优，分别为每百万个Token 10 美分和 60 美分。

目前每个为每个开发者每天提供 100 万个免费 Token。

先搞个 API 家人们。

Cerebras 推理采用第三代 Wafer Scale Engine（WSE-3），它拥有 21 兆字节 / 秒的内存带宽，能够存储整个模型在芯片上，从而消除了外部内存的需求。

公告地址：

请到「今天看啥」查看全文

推荐文章

蛋先生工作室 · 2025年2月25日最新蛋价（上午）

昨天

江南都市报 · 即日起正式启动！全省有奖公开征集！

昨天

潮司电商客服外包 · 拼多多抢抖音商家？平台的反击战还是来了

2 天前

电子商务研究中心 · A股IPO败北后盘兴数智转战港股是无奈之举还是另辟蹊径？

2 天前

玺承电商观察 · 从CORE新流量机制到付费投流，多维度教你在抖音获得高变现！

4 天前

玺承电商观察 · 从CORE新流量机制到付费投流，多维度教你在抖音获得高变现！

4 天前

BetterRead · BetterRead英文书漂流瓶计划书单第四十一批

8 年前

匈牙利新导报 · 【首届中欧华人歌唱大赛暨2017年"文化中国·水立方杯"匈牙利赛区选拔赛】现正火热报名中诚邀加盟协办

7 年前

法学学术前沿 · 【论道】周刚志：国家监察机关的宪法定位

7 年前

超能网 · 去中国化的虚拟货币现在活得怎么样？交易所都倒闭了吗？

7 年前

法律读品 · 你还在学“伪”法律英语吗？

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!