|
征稿 | 第一届多模态生成评估研讨会 @ COLING 2025 我爱计算机视觉 · 公众号 · · 3 月前 · |
|
|
[通用的视觉Backbone] TransXNet: 全局动态性+局部动态性=性能强大,代码已开源! 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
华科&华为发布首款基于国产芯片适配的多模态大模型“PDF悟空”,解析长文档多模态数据能力 SOTA 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
EMNLP 2024 | 阿里通义实验室提出MLLM多图能力评估基准MIBench 我爱计算机视觉 · 公众号 · AI 科技自媒体 · 4 月前 · |
|
|
北京大学 | 提出基于多模态大语言模型的可解释图像篡改检测定位 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
行人重识别与人群计数数据集大盘点:推动智能监控研究的利器 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
又中稿一篇顶刊论文!后悔没早点发现这个方法 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
探索VIOBOT:机器人的三维视觉感知技术🤖 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
YOLOv1-v11系列全记录 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
ECCV 2024奖项公布,哥大摘得最佳论文奖桂冠 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
校招 | 全球顶尖三维智能空间计算企业其域创新,2025校招进行中! 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
3D场景的大语言模型:在鲁棒数据训练下的3DLLM新SOTA! 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
IJCAI 2024 | 更快、更便捷的3D场景生成算法 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
ECCV 2024 Oral | Co-Instruct: 让通用多模态大模型学会比较视觉质量 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
《AI系统:原理与架构》于华为HC大会2024正式发布 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
ECCV 2024丨跨域小样本物体检测CD-FSOD新数据集、CD-ViTO新方法(数据代码均已开源) 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
打破CloseAI的垄断,开源一个多模态版本的OpenAI o1! 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
超越YOLO、DETR!最强新生代目标检测器! 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
ECCV 2024 Oral | 西南交大&利兹大学等联合提出金字塔离散扩散模型(PDD),实现了3D户外场景生成的粗到细的策略 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
ECCV2024 (oral) | 突破场景图生成的边界:OvSGTR 实现全开放词汇场景图生成 我爱计算机视觉 · 公众号 · · 4 月前 · |
|