|
AAAI 2025 | SparseViT:参数高效的稀疏化视觉Transformer 极市平台 · 公众号 · · 1 月前 · |
|
|
谈谈DeepSeek-v3在算力约束下的出色工作 极市平台 · 公众号 · · 1 月前 · |
|
|
我与vLLM的2024:清华大佬的vLLM开发之路 极市平台 · 公众号 · · 1 月前 · |
|
|
当红炸子鸡 LoRA,是当代微调 LLMs 的正确姿势? 极市平台 · 公众号 · · 1 月前 · |
|
|
大模型轻量化解读系列 (五):QuaRot:基于 Rotation 的 4-bit LLM 量化 极市平台 · 公众号 · · 1 月前 · |
|
|
NeurIPS 2024 | DACER:扩散模型与在线强化学习强强联合创造新SOTA! 极市平台 · 公众号 · · 1 月前 · |
|
|
谷歌劈柴立军令状:必斩OpenAI,夺回第一! 极市平台 · 公众号 · · 1 月前 · |
|
|
无需训练!多提示视频生成最新SOTA!港中文&腾讯等发布DiTCtrl:基于MM-DiT架构 极市平台 · 公众号 · · 1 月前 · |
|
|
实践教程|图解NumPy,这是理解数组最形象的一份教程了 极市平台 · 公众号 · · 1 月前 · |
|
|
AAAI 2025 | 合成数据助力自驾点云异常检测新SOTA 极市平台 · 公众号 · · 1 月前 · |
|
|
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开 极市平台 · 公众号 · · 1 月前 · |
|
|
AAAI 2025 | 港大提出SparX:强化Vision Mamba和Transformer的稀疏跳跃连接机制 极市平台 · 公众号 · · 1 月前 · |
|
|
4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级 极市平台 · 公众号 · · 1 月前 · |
|
|
【CUDA编程】手撸一个大模型推理框架 FasterLLaMA 极市平台 · 公众号 · · 1 月前 · |
|
|
写代码的时候,请心疼一下读代码的同事 极市平台 · 公众号 · · 1 月前 · |
|
|
位置编码背后的理论解释——傅里叶特征 (Fourier Feature)与核回归 极市平台 · 公众号 · · 1 月前 · |
|
|
超越ControlNet++!腾讯优图提出动态条件选择新架构 极市平台 · 公众号 · · 1 月前 · |
|
|
AAAI 2025|多场景行人属性识别基准数据集MSP60K:57个类别和8个特定场景 极市平台 · 公众号 · · 1 月前 · |
|
|
MIT、OpenAI等震撼力作:AI首次自主发现人工生命!人类窥见上帝造物 极市平台 · 公众号 · · 1 月前 · |
|
|
文生图击败所有扩散SOTA方案!智源研究院等提出NOVA:迈向统一的多任务大模型 极市平台 · 公众号 · 科技自媒体 · 1 月前 · |
|