专栏名称: 计算机视觉深度学习和自动驾驶

讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战

目录

相关文章推荐

乐游上海 · 市中心又一新地标，明起对公众开放！ · 5 小时前

上海发布 · 2月份沪牌拍卖结果公布 · 昨天

冯唐 · 别再瞎折腾了！中年改命只需做好这一件事 · 3 天前

读书杂志 · 《读书》新刊｜孙宇辰：冷战自由主义的幽灵 · 2 天前

掌上澄江 · 你好澄江丨抚仙湖畔，春风抚芦苇 · 3 天前

掌上澄江 · 你好澄江丨抚仙湖畔，春风抚芦苇 · 3 天前

51好读 › 专栏 › 计算机视觉深度学习和自动驾驶

LightLLM：轻量高速的LLM推理服务平台

计算机视觉深度学习和自动驾驶 · 公众号 · · 2024-05-22 01:04

正文

LightLLM是一个基于Python的LLM（大型语言模型）推理和服务框架，以其轻量级设计、易于扩展和高速性能而闻名：

https://github.com/ModelTC/lightllm github.com/ModelTC/lightllm

LightLLM利用了许多备受好评的开源实现优势，包括FasterTransformer、TGI、vLLM和FlashAttention等。

vLLM中采用的 PagedAttention 将KV缓存存储在不连续的内存空间中。虽然PagedAttention在一定程度上缓解了内存碎片，但仍然为内存浪费留出了空间。此外，在处理多个高并发请求时，内存块的分配和释放效率低下，导致内存利用率不理想。

LightLLM 包括以下特点：

三进程异步协作：token化、模型推理和去token化是异步执行的，从而大大提高了GPU的利用率。
Nopad（Unpad）：支持跨多个模型的无填零注意操作，有效处理长度差异较大的请求。
动态批处理：请求的动态批处理调度。
FlashAttention ：结合FlashAttention（“ FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness“ ，2022

请到「今天看啥」查看全文

推荐文章

乐游上海 · 市中心又一新地标，明起对公众开放！

5 小时前

上海发布 · 2月份沪牌拍卖结果公布

昨天

冯唐 · 别再瞎折腾了！中年改命只需做好这一件事

3 天前

读书杂志 · 《读书》新刊｜孙宇辰：冷战自由主义的幽灵

2 天前

掌上澄江 · 你好澄江丨抚仙湖畔，春风抚芦苇

3 天前

掌上澄江 · 你好澄江丨抚仙湖畔，春风抚芦苇

3 天前

艾瑞咨询 · 季度数据发布 - 第三方支付

8 年前

手艺门 · 如果楼梯都设计成这样，那天天走我都愿意...

8 年前

良仓 · “香”得益彰礼盒——当茉莉花遇到乌龙茶，当玫瑰花遇到红茶

8 年前

娱乐哔姐 · 年终小生盘点来了，鹿晗最稳定？李易峰人气下滑？杨洋热度最高？

8 年前

点点星光 · 今天情人节，致我最在乎的人！

8 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!