FightingCV - 公众号 - 文章列表 - 历史文章

文章总数 2346

51好读 › 专栏 › FightingCV

一个专注于分享计算机视觉、多模态机器学习方向前沿论文，解答常见科研问题，分享好用科研工具的公众号。努力努力再努力，瑞思拜！

最新

我今年读过最绝的一本LLM书！

FightingCV · 公众号 · · 2 月前 ·

CoMamba超Transformer模型实现SOTA性能！单卡可跑！

FightingCV · 公众号 · · 2 月前 ·

被导师放养，不影响发论文

FightingCV · 公众号 · · 2 月前 ·

CorrCLIP：利用现成基础模型重建CLIP中的相关性以实现开放词汇语义分割

FightingCV · 公众号 · 科技创业科技媒体 · 2 月前 ·

NeurIPS 2024 | MaVEn：面向多模态大模型多图理解的连续/离散视觉混合编码策略

FightingCV · 公众号 · · 2 月前 ·

CogVLM：预训练语言模型的视觉专家

FightingCV · 公众号 · · 2 月前 ·

VeCLIP：通过视觉增强的字幕改进CLIP训练

FightingCV · 公众号 · · 2 月前 ·

MetaTransformer：一种用于多模态学习的统一框架

FightingCV · 公众号 · · 2 月前 ·

视觉语言大模型新SOTA！高效微调方法性能碾压LoRA

FightingCV · 公众号 · · 2 月前 ·

Github目标检测开源项目大合集

FightingCV · 公众号 · · 2 月前 ·

长短期 Transformer ：用于语言和视觉的高效 Transformer

FightingCV · 公众号 · · 2 月前 ·

DINO-X：一种用于开放世界目标检测和理解的统一视觉模型

FightingCV · 公众号 · · 2 月前 ·

CLIP2Scene：通过 CLIP 实现标签高效的 3D 场景理解

FightingCV · 公众号 · · 2 月前 ·

GALIP：用于文本到图像合成的生成对抗CLIP

FightingCV · 公众号 · 算法科技媒体 · 2 月前 ·

用于密集物体检测的Focal损失

FightingCV · 公众号 · · 2 月前 ·

最近注意力机制疯狂涨点，即插即用

FightingCV · 公众号 · · 2 月前 ·

EventCLIP：面向事件的物体识别的CLIP适配方法

FightingCV · 公众号 · · 2 月前 ·

ProtoCLIP：原型对比语言图像预训练

FightingCV · 公众号 · · 3 月前 ·

统一的文本到图像的生成和检索

FightingCV · 公众号 · · 3 月前 ·

Inf-MLLM：单 GPU 上多模态大型语言模型的高效流式推理

FightingCV · 公众号 · · 3 月前 ·

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!