|
开源模型争霸赛!Qwen2.5登顶!72B模型击败LIama3 405B,轻松胜过GPT-4o-mini 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
ECCV2024 | AddressCLIP:一张图实现街道级定位,端到端图像地理定位大模型 我爱计算机视觉 · 公众号 · · 4 月前 · |
|
|
首次!用合成人脸数据集训练的识别模型,性能高于真实数据集 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
如何让大模型更好地进行场景落地? 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
挑战当前最难、规模最大多模态评测基准MME-RealWorld,QwenVL-2位列第一但并未及格 我爱计算机视觉 · 公众号 · 科技自媒体 · 5 月前 · |
|
|
轻量检测之王!LW-DETR:超越 YOLO系列? 我爱计算机视觉 · 公众号 · 互联网安全 科技自媒体 · 5 月前 · |
|
|
从LabelMe到一键Label All! 8 款数据标注工具真实试用推荐 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
mPLUG-DocOwl2: OCR-free多页文档理解新SOTA,单页视觉token仅324! 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
深度揭秘阴影世界:深度学习时代图像与视频阴影的检测、去除与生成全面综述 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
实习 | 字节跳动 AML 日常实习生招聘,多模态大模型方向 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
基于YOLOv8超强改进!CVPR'24检测万物新王者! 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
牛津光计算论文登Nature正刊,分析帕金森患者步态准确率达92.2% 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
搜索图片有新招了!北大课题组提出图像检索新方法,输入草图or艺术or低分辨率 | ECCV 2024 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
Mamba作者新作:将Llama3蒸馏成混合线性 RNN 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
计算机视觉大佬推荐的深度学习教程书 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
模型仅664KB,LAR-IQA:开源、轻量级、准确且鲁棒的无参考图像质量评价模型 我爱计算机视觉 · 公众号 · 科技自媒体 · 5 月前 · |
|
|
《黑神话:悟空》里惊艳的古建场景是如何生成的? 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
重磅发布|中国人工智能学会推荐国际学术会议和国际/国内期刊目录 我爱计算机视觉 · 公众号 · · 5 月前 · |
|
|
机器学习四大名著之一“蜥蜴书”全新升级第3版来了! 我爱计算机视觉 · 公众号 · 科技自媒体 科技媒体 · 5 月前 · |
|
|
冻结语言模型训练LMM新范式,360提出IAA,使语言模型无损获取多模态理解与Grounding能力! 我爱计算机视觉 · 公众号 · · 5 月前 · |
|