|
ICLR 2025 | 极性感知线性注意力!PolaFormer:全新视觉基础模型 极市平台 · 公众号 · · 15 小时前 · |
|
|
诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步 极市平台 · 公众号 · · 15 小时前 · |
|
|
Deepseek R1 Zero成功复现全过程:三阶段RL,Response长度涨幅超50%,涌现语言混杂 极市平台 · 公众号 · · 15 小时前 · |
|
|
ICLR 2025 高分论文!何恺明和刘壮提出:数据集偏差的十年之战 极市平台 · 公众号 · · 15 小时前 · |
|
|
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观 极市平台 · 公众号 · · 1 周前 · |
|
|
一文详尽之Scaling Law 极市平台 · 公众号 · AI 科技媒体 · 1 周前 · |
|
|
Linear Attention的cuda kernel实现解析 极市平台 · 公众号 · · 1 周前 · |
|
|
为什么说DeepSeek的R1-Zero比R1更值得关注? 极市平台 · 公众号 · · 1 周前 · |
|
|
完整解读:从DeepSeek Janus到Janus-Pro! 极市平台 · 公众号 · · 1 周前 · |
|
|
ICLR 2025 | 超越YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定义边界框回归任务 极市平台 · 公众号 · · 1 周前 · |
|
|
原来,这些顶级大模型都是蒸馏的 极市平台 · 公众号 · · 1 周前 · |
|
|
DeepSeek V3论文细节:如何绕开CUDA的垄断! 极市平台 · 公众号 · · 1 周前 · |
|
|
图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和inference scaling新范式! 极市平台 · 公众号 · · 1 周前 · |
|
|
大模型LLM-微调经验分享 & 总结 极市平台 · 公众号 · · 2 周前 · |
|
|
CS本科就业寒冬来袭!名校24届就业率被曝不足50%,企业宁用AI不招应届生 极市平台 · 公众号 · · 2 周前 · |
|
|
TNNLS'25|东北大学贾同教授团队提出SOTA模型AO-DETR,解决X-ray图像违禁品检测领域难题! 极市平台 · 公众号 · · 2 周前 · |
|
|
ICLR 2025|4K分辨率拿下!超强杀器SANA:线性扩散模型+文生图+高分辨率+从头训练的极佳范本! 极市平台 · 公众号 · · 2 周前 · |
|
|
一文详尽之LLM-Based Agent 极市平台 · 公众号 · · 2 周前 · |
|
|
中国AI太强,Meta工程师吓疯?自曝疯狂熬夜复制DeepSeek,天价高管心虚了 极市平台 · 公众号 · · 2 周前 · |
|
|
ICLR 2025 | Ross: 多模态大模型的 MAE 时刻? 极市平台 · 公众号 · · 2 周前 · |
|