专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
机器之心  ·  FP8训练新范式:减少40%显存占用,训练速 ... ·  2 天前  
新智元  ·  离谱!OpenAI被曝博士级AI智能体2万美 ... ·  2 天前  
51好读  ›  专栏  ›  爱可可-爱生活

【[117星]LLaMA Box:基于C++实现的高性能LM推理-20250306140951

爱可可-爱生活  · 微博  · AI  · 2025-03-06 14:09

正文

2025-03-06 14:09

【[117星]LLaMA Box:基于C++实现的高性能LM推理服务器,兼容OpenAI API,为大语言模型推理提供强大支持。亮点:1. 支持多种模型,涵盖LLaMA、Stable Diffusion等;2. 多平台支持,适配NVIDIA、AMD、Intel等多种硬件;3. 高效的RPC服务器模式,可分布式部署模型推理任务】
'LLaMA Box is an LM inference server (pure API, w/o frontend assets) based on llama.cpp and stable-diffusion.cpp.'
GitHub: github.com/gpustack/llama-box
#大语言模型# #推理服务器# #多平台支持# #AI创造营#






请到「今天看啥」查看全文