|
爆拉UniAD近40%,推理提升3倍!UAD:全新纯视觉端到端SOTA(问鼎nuScenes) 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
大语言模型推理加速技术:计算加速篇 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
大语言模型推理加速技术-模型压缩篇 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
Meta 元 LLM 编译器:编译器优化的基础模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
无干扰推理:混合下游工作负载的 分解LLM 推理 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
Splitwise:使用相位分裂实现高效生成式 LLM 推理 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
大语言模型的快速分布式推理服务 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
迈向『闭环』| PlanAgent:基于MLLM的自动驾驶闭环规划新SOTA! 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
重新定义端到端自动驾驶!SparseDrive:所有任务都超过现有SOTA(清华&地平线) 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
Prompt Cache:模块化注意重用实现低延迟推理 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
DistServe:分解预填充和解码实现吞吐量优化的LLM服务 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
复旦TravelPlanner让大语言模型挑战旅程规划 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
AI Agent之ProAgent 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
论文精读1:Agent-Pro 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
微软AI力作!Orca 2模型崭露头角,引领推理和语言处理新潮流! 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
OSDI 2024 用Sarathi-Serve驾驭LLM推理:轻松平衡吞吐与延迟 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
AttentionStore 论文解读 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
Mooncake:LLM服务的KVCache为中心分解架构 计算机视觉深度学习和自动驾驶 · 公众号 · · 7 月前 · |
|
|
Orca 来自微软的葵花宝典:利用GPT-4 让LLaMA在2个月内赶上ChatGPT的推理能力 计算机视觉深度学习和自动驾驶 · 公众号 · 科技媒体 · 7 月前 · |
|