文章总数 2346
51好读  ›  专栏  ›  FightingCV
一个专注于分享计算机视觉、多模态机器学习方向前沿论文,解答常见科研问题,分享好用科研工具的公众号。努力努力再努力,瑞思拜!
LLaVA-o1: 视觉语言模型逐步推理
FightingCV  ·  公众号  ·  ·  3 周前  · 
LLaVA-PLUS:学习使用工具创建多模式代理
FightingCV  ·  公众号  ·  ·  4 周前  · 
用于泛化图像去噪的迁移CLIP模型
FightingCV  ·  公众号  ·  ·  1 月前  · 
VideoCLIP:零镜头视频文本理解的对比预训练
FightingCV  ·  公众号  ·  ·  1 月前  · 
IDEA:图像描述增强型CLIP适配器
FightingCV  ·  公众号  ·  ·  1 月前  · 
利用合成提示改进CLIP的零样本泛化能力
FightingCV  ·  公众号  ·  ·  1 月前  · 
LocCa:使用位置感知字幕进行视觉预训练
FightingCV  ·  公众号  ·  ·  1 月前  · 
登上nature的LSTM算法
FightingCV  ·  公众号  ·  ·  1 月前  · 
扩散反馈帮助 CLIP 看得更清楚
FightingCV  ·  公众号  ·  ·  1 月前  · 
聚合和适应自然语言提示用于 CLIP 的下游泛化
FightingCV  ·  公众号  ·  ·  1 月前  · 
CLIP-Count:迈向文本引导的零样本目标计数
FightingCV  ·  公众号  ·  ·  1 月前  · 
VideoRAG: 视觉对齐检索增强长视频理解
FightingCV  ·  公众号  ·  ·  1 月前  ·