|
InternEvo:通过混合并行和冗余分片实现高效长序列大语言模型训练 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
LLAMA-FACTORY:100+语言模型的统一高效微调框架 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
Transformer 进行长文本建模:综述 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
LongWanjuan:长文本质量的系统测量 计算机视觉深度学习和自动驾驶 · 公众号 · 大数据 科技媒体 · 8 月前 · |
|
|
PowerInfer:使用消费级 GPU 提供快速大语言模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
Turbo Sparse:以最少的激活参数实现 LLM 最先进性能 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
PowerInfer-2:智能手机上的大语言模型快速推理 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
大语言模型中上下文长度扩展技术的内容、原因和方式-综述 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
在长上下文的大语言模型中Transformer 架构:综述 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
超越极限:在大语言模型中扩展上下文长度的技术综述 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
基础模型的高效长上下文扩展 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
LLM长上下文的问题 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
基于RoPE外推的规模化定律 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
解锁大模型长上下文能力 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
长上下文任务是否非得长上下文大语言模型来应对? 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
迈向长上下文RAG 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
大模型长上下文窗口技术探索 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
Qwen 2 模型介绍及其应用探索 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
用大模型做一个专职机器人(二)官方助手 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|
|
使用Qwen-Agent将上下文记忆扩展到百万量级 计算机视觉深度学习和自动驾驶 · 公众号 · · 8 月前 · |
|