|
图像美感增强SOTA,拒绝美感焦虑!字节跳动提出VMix:多维度美学控制方法,一键提升图像光影、色彩等 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
从文字到视觉:EvalMuse-40K如何评价T2I模型的进化 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
开放词汇检测新晋SOTA:地瓜机器人开源DOSOD实时检测算法 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
GPU算力新平台亮相不语,只一味豪撒福利,GpuGeek到底藏着什么大招? 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
港大达摩院【视频AI任意门】,向视频无缝传送物体,同时支持准确动作控制 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
复旦&字节提出CreatiLayout:基于布局进行可控生成的大规模数据集与新SOTA! 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
NeurIPS 2024 | 基于内联先验引导分数匹配的稀疏视角三维重建 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
顶尖性能,训练成本仅1/10!中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅600万美元 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
AAAI2025|IMAGDressing-v1:南理工提出新的图像生成任务,可定制的虚拟穿衣,数据和代码已经开源 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
3D凸体投影:使用3D平滑凸体的辐射场渲染 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
AAAI 2025 | SparX:一种强化Vision Mamba和Transformer的稀疏跳跃连接机制,性能强大已开源! 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
AAAI 2025 | 探索对抗训练的概率分布偏差:DPA 双概率对齐的通用域自适的目标检测方法 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
全奖博士招生,总资助137万人民币 | 英国工程与物理科学研究基金会专项 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
水下检测+扩散模型:或成明年CVPR最大惊喜! 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
一键部署【Qwen2.5-Coder-Artifacts】通义千问Coder-32B编程神器 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
一键部署【OuteTTS-0.2-500M】开源语音合成模型 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
请问你能跟我一起跳舞吗?复旦&微软提出StableAnimator: 首个端到端的高质量ID一致性人类视频生成新框架! 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
一键部署腾讯混元超牛视频生成器【HunyuanVideo】,130亿参数铸就极致体验 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
为什么说在中国做科研最忌讳踏实? 我爱计算机视觉 · 公众号 · · 1 月前 · |
|