#一转眼明天就要上班了#头条在国庆期间发布了一个比较牛x的论文,感觉看一下!#ai##科技#
Depth Pro:不到一秒即可获得清晰的单目测量深度
该论文提出了零样本度量单目深度估计的基础模型 Depth Pro
• 可以合成高分辨率深度图,具有无与伦比的清晰度和高频细节。
• 预测是度量的,具有绝对比例,不依赖于相机内在参数等元数据的可用性。
• 速度很快,可以在标准 GPU 上 0.3 秒内生成 225 万像素的深度图。
这些特性是由许多技术贡献实现的,包括用于密集预测的高效多尺度视觉变换器、结合真实和合成数据集以实现高度量精度以及精细边界跟踪的训练协议、估计深度图中边界精度的专用评估指标以及从单个图像进行最先进的焦距估计。
项目:github.com/apple/ml-depth-pro
论文:arxiv.org/abs/2410.02073
Demo:huggingface.co/spaces/akhaliq/depth-pro
模型:huggingface.co/apple/DepthPro
ChatGPT
Depth Pro:不到一秒即可获得清晰的单目测量深度
该论文提出了零样本度量单目深度估计的基础模型 Depth Pro
• 可以合成高分辨率深度图,具有无与伦比的清晰度和高频细节。
• 预测是度量的,具有绝对比例,不依赖于相机内在参数等元数据的可用性。
• 速度很快,可以在标准 GPU 上 0.3 秒内生成 225 万像素的深度图。
这些特性是由许多技术贡献实现的,包括用于密集预测的高效多尺度视觉变换器、结合真实和合成数据集以实现高度量精度以及精细边界跟踪的训练协议、估计深度图中边界精度的专用评估指标以及从单个图像进行最先进的焦距估计。
项目:github.com/apple/ml-depth-pro
论文:arxiv.org/abs/2410.02073
Demo:huggingface.co/spaces/akhaliq/depth-pro
模型:huggingface.co/apple/DepthPro
ChatGPT