|
我今年读过最绝的一本LLM书! FightingCV · 公众号 · · 2 月前 · |
|
|
CoMamba超Transformer模型实现SOTA性能!单卡可跑! FightingCV · 公众号 · · 2 月前 · |
|
|
被导师放养,不影响发论文 FightingCV · 公众号 · · 2 月前 · |
|
|
CorrCLIP:利用现成基础模型重建CLIP中的相关性以实现开放词汇语义分割 FightingCV · 公众号 · 科技创业 科技媒体 · 2 月前 · |
|
|
NeurIPS 2024 | MaVEn:面向多模态大模型多图理解的连续/离散视觉混合编码策略 FightingCV · 公众号 · · 2 月前 · |
|
|
CogVLM:预训练语言模型的视觉专家 FightingCV · 公众号 · · 2 月前 · |
|
|
VeCLIP:通过视觉增强的字幕改进CLIP训练 FightingCV · 公众号 · · 2 月前 · |
|
|
MetaTransformer:一种用于多模态学习的统一框架 FightingCV · 公众号 · · 2 月前 · |
|
|
视觉语言大模型新SOTA!高效微调方法性能碾压LoRA FightingCV · 公众号 · · 2 月前 · |
|
|
Github目标检测开源项目大合集 FightingCV · 公众号 · · 2 月前 · |
|
|
长短期 Transformer :用于语言和视觉的高效 Transformer FightingCV · 公众号 · · 2 月前 · |
|
|
DINO-X:一种用于开放世界目标检测和理解的统一视觉模型 FightingCV · 公众号 · · 2 月前 · |
|
|
CLIP2Scene:通过 CLIP 实现标签高效的 3D 场景理解 FightingCV · 公众号 · · 2 月前 · |
|
|
GALIP:用于文本到图像合成的生成对抗CLIP FightingCV · 公众号 · 算法 科技媒体 · 2 月前 · |
|
|
用于密集物体检测的Focal损失 FightingCV · 公众号 · · 2 月前 · |
|
|
最近注意力机制疯狂涨点,即插即用 FightingCV · 公众号 · · 2 月前 · |
|
|
EventCLIP:面向事件的物体识别的CLIP适配方法 FightingCV · 公众号 · · 2 月前 · |
|
|
ProtoCLIP:原型对比语言图像预训练 FightingCV · 公众号 · · 3 月前 · |
|
|
统一的文本到图像的生成和检索 FightingCV · 公众号 · · 3 月前 · |
|
|
Inf-MLLM:单 GPU 上多模态大型语言模型的高效流式推理 FightingCV · 公众号 · · 3 月前 · |
|