|
来自非自回归模型的反击?全新文生图基座模型Meissonic:1B文生图Non-AR新范式 专为消费级显卡设计 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
NeurIPS2024 | OCR-Omni来了,字节&华师提出统一的多模态文字理解与生成大模型 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
MonST3R | UC伯克利、DeepMind等提出的运动状态下估算几何图形的先进方法 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
TPAMI 2024 无监督盲超分算法 MLMC,代码已开源! 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
综述|Drones 2024 基于视觉的反无人机综述 我爱计算机视觉 · 公众号 · 科技自媒体 · 4 月前 · |
|
|
“左脚踩右脚”提升文生图模型综合能力!清北牛津普林斯顿联合发布 IterComp 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
开源了!阿里轨迹控制版视频生成 Tora 开源发布 我爱计算机视觉 · 公众号 · 互联网短视频 科技自媒体 · 4 月前 · |
|
|
ArXiv 2024 | 揭秘视觉表征学习中的骨干网络-优化器耦合偏好 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
已开放!!!黑色素瘤组织和细胞核全景分割挑战赛 (PUMA challenge) 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
今年顶会这情况。。。大家提前做准备吧! 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
项目合作 | 孔隙结构分析与生成 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
征稿 | 第一届多模态生成评估研讨会 @ COLING 2025 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
[通用的视觉Backbone] TransXNet: 全局动态性+局部动态性=性能强大,代码已开源! 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
华科&华为发布首款基于国产芯片适配的多模态大模型“PDF悟空”,解析长文档多模态数据能力 SOTA 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
EMNLP 2024 | 阿里通义实验室提出MLLM多图能力评估基准MIBench 我爱计算机视觉 · 公众号 · AI 科技自媒体 · 4 月前 · |
|
|
北京大学 | 提出基于多模态大语言模型的可解释图像篡改检测定位 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
行人重识别与人群计数数据集大盘点:推动智能监控研究的利器 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
又中稿一篇顶刊论文!后悔没早点发现这个方法 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
探索VIOBOT:机器人的三维视觉感知技术🤖 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
YOLOv1-v11系列全记录 我爱计算机视觉 · 公众号 · · 5 月前 · |
|