专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
目录
相关文章推荐
蛋先生工作室  ·  2025年2月25日最新蛋价(上午) ·  昨天  
江南都市报  ·  即日起正式启动!全省有奖公开征集! ·  昨天  
潮司电商客服外包  ·  拼多多抢抖音商家?平台的反击战还是来了 ·  2 天前  
电子商务研究中心  ·  A股IPO败北后 ... ·  2 天前  
玺承电商观察  ·  从CORE新流量机制到付费投流,多维度教你在 ... ·  4 天前  
玺承电商观察  ·  从CORE新流量机制到付费投流,多维度教你在 ... ·  4 天前  
51好读  ›  专栏  ›  歸藏的AI工具箱

Cerebras 也来抢 Groq 的生意了,推出世界上最快的 -20240828154327

歸藏的AI工具箱  · 微博  ·  · 2024-08-28 15:43

正文

2024-08-28 15:43

Cerebras 也来抢 Groq 的生意了,推出世界上最快的 LLM 推理服务。 #ai#

Llama 3.1 8B 的生成数独可以到每秒1800Token,70B 可以达到 450 Token。

且价格更优,分别为每百万个Token 10 美分和 60 美分。

目前每个为每个开发者每天提供 100 万个免费 Token。

先搞个 API 家人们。

Cerebras 推理采用第三代 Wafer Scale Engine(WSE-3),它拥有 21 兆字节 / 秒的内存带宽,能够存储整个模型在芯片上,从而消除了外部内存的需求。

公告地址: 网页链接






请到「今天看啥」查看全文