深度学习论文实现:空间变换网络,Spatial Transformer Networks,主要提高图像识别时候对输入图像的鲁棒性。当处理分类任务时,通常希望我们的系统对于输入变化是鲁棒的。如果一个输入经历一定的“转换”,我们的分类模型应该在理论上吐出与之前相同的类标签。我们的图像分类模型可能面临的“挑战”的几个例子包括:
尺度变化:在真实世界和图像中的尺寸变化。
视点变化:相对于观看者的不同的对象取向。
变形:非刚性体可以变形和扭曲成不寻常的形状
第一部分:
The first three blog posts in my “Deep Learning Paper Implementations” series will cover
Spatial Transformer Networks
introduced by
Max Jaderberg, Karen Simonyan, Andrew Zisserman and Koray Kavukcuoglu
of Google Deepmind in 2016. The Spatial Transformer Network is a
learnable module aimed at increasing the spatial invariance of
Convolutional Neural Networks in a computationally and parameter
efficient manner.