正文
发布人:Google Research 软件工程师 André Araujo 和 Tobias Weyand
图像分类技术在过去几年取得了显著进步,例如在
Imagenet
分类挑战赛中,错误率
每年都在大幅下降
。为了继续推进计算机视觉的发展,许多研究员现在将更多精力放在精细和实例级识别问题上
- 许多人都在设计能够识别埃菲尔铁塔、富士山或波斯猫的机器学习算法,而不是识别建筑物、山峰和猫等一般实体。不过,这个领域一个比较大的研究障碍是缺乏大型的标注数据集。
我们高兴地宣布 Google-Landmarks,它是全世界最大的人造和自然地标识别数据集,希望这个工具能推动实例级识别的发展。Google-Landmarks 将作为
地标识别
和
地标检索
Kaggle 挑战赛的一部分发布,这两个挑战赛将是
CVPR’18 Landmarks 专题讲座
的重点。数据集包含超过 200 万个图像,这些图像描绘了全世界 3 万个独特的地标(它们的地理分布如下图所示),许多类别要比现在的常用数据集大 30 倍左右。此外,为了激励这个领域的研究,我们将
开源
Deep Local Features (
DELF
),我们认为这个专用的本地特征描述符数据库非常适合这种任务。
|
我们数据集中的地标的地理分布。
|
地标识别具有一些与其他问题显著不同的差异。例如,即使在一个大型标注数据集中,也可能没有很多用于一些不知名地标的训练数据。此外,由于地标通常是不可移动的刚性对象,类别内变化非常小(换句话说,地标的外观在它的不同图像中不会发生很大变化)。因此,变化仅来自于拍照条件(例如遮蔽、不同的视角、天气和光照),这就让地标与其他图像识别数据集不同,在其他数据集中,某种类别图像(例如狗)的差异可能非常大。其他实例级识别问题(例如
艺术品识别
)也有这些特性
- 因此,我们希望新数据集也能为其他图像识别问题的研究提供帮助。