专栏名称: 雷峰网
中国智能硬件第一媒体
目录
相关文章推荐
新浪科技  ·  【#无创血糖手表靠谱吗# ... ·  4 天前  
新浪科技  ·  【#Steam季票规则更新##Steam要求 ... ·  4 天前  
新浪科技  ·  【#新兴业态情绪消费要如何规范# ... ·  1 周前  
51好读  ›  专栏  ›  雷峰网

独家采访 | 苹果首篇AI论文获奖遭质疑,是价值有限还是实至名归?

雷峰网  · 公众号  · 科技媒体  · 2017-08-05 09:57

正文

雷锋网AI科技评论按:苹果第一篇AI论文一经投放,便斩获CVPR 2017最佳论文。随后便有外界不断猜测苹果的论文质量有水分,似乎不能匹配最佳论文的头衔。

雷锋网记者随后从学术角度采访了几位学术界人士。看看他们怎么说。

苹果的AI研究消息首次进入公众视野的是在去年的12月初。

  • 2016年12月8日,在西班牙NIPS 2016大会上,苹果AI研究负责人Russ Salakhutdinov承诺将会公布和分享他们的最新AI研究成果。

  • 2016年12月22日,首篇机器学习论文通过康奈尔大学图书馆出版,显示的提交时间是11月15日。

  • 2017年7月19日,苹果开通机器学习博客(Apple Machine Learning Journal ),同时发表一篇题为“Improving the Realism of Synthetic Images”的文章。这篇文章用更通俗的语言介绍了之前发表的论文。

  • 2017年7月22日,苹果的这篇论文获CVPR 2017最佳论文。

回顾一下这篇论文的主要内容:

这篇题为《通过对抗训练从模拟的和无监督的图像中学习》是图像识别领域的论文。

论文中,提出了一个“模拟+无监督学习”(simulated + unsupervised learning)的学习方法,使用的是如今非常火的深度学习“对抗训练”。GANs(对抗训练)发明者Ian Goodfellow得知苹果的第一篇机器学习论文是关于GANs,也十分兴奋,并在自己的推特中第一时间转了这篇论文。

GANs模型,简单的说就是让两个网络相互竞争,玩一个“猫鼠游戏”。

一个叫做生成器网络G( Generator Network),它不断捕捉训练库里真实图片的概率分布,将输入的随机向量转变成新的样本。一句话,G负责生成假图片。

另一个叫做判别器网络D(Discriminator Network),它可以同时观察真实和假造的数据,判断这个图片到底是不是真的。

G尝试用自己的生成的仿品来“蒙骗”D,而D也不断提高自己鉴别真伪的水平。这样G的造假能力和D的鉴别能力都会越来越高超。

而苹果的“对抗训练”是对原有的GANs模型做了稍加的修改,形成了自己的SimGANs模型。其中sim是单词 Simulator的缩写,即模拟器的意思。

苹果的SimGANs其实包括三部分:模拟器(Simulator)和精制器(Refiner),然后再加上一个判别器(Discriminator)。模拟器合成图像,再用精制器做优化使得更像真实图片,最后再由判别器做识别训练。

苹果也在自己的论文摘要中提到: “我们的模拟+无监督学习方法,使用的对抗网络跟GANs很类似。但是,输入值是合成图像,而不是随机向量。

随后便有学术界人士质疑,指出苹果的创新并不是具有突破性的,似乎不够资格评选为“最佳论文”。

甚至在知名问答社区知乎上有人从论文的第一作者背景开始怀疑,最佳论文评选过程有暗箱操作的嫌疑。

点赞数最多的答主回答:

论文第一作者Ashish Shrivastava,马里兰大学计算机视觉博士

学术界人士这样看

随后雷锋网驻国外记者也就「今年的CVPR 最佳论文是否实至名归」这个问题采访了几位学术界人士:

CrowdAI 研究员Jigar Doshi接受采访说:

(因为总共有两篇最佳论文,他先从第一篇谈起)第一篇Densely Connected Convolutional Networks(密集连接的卷积网络)中,DenseNet模型有两大贡献,一个是计算效率提升,大幅度地减少了参数数量,模型训练出来的精确度和质量都要比之前好。还有就是模型能够泛化,研究者用了好几个数据集,用来展示研究成果可以用到其他数据集和场景中。这是一个大家都能用,一个通用的方法。大家都在看,都在讨论,这篇论文是值得评为最佳论文的。

谈到苹果的SimGANs,Jigar评论到:SimGANs的优点是无需标注自动生成新数据,但是他在演示过程中只用了一个数据集,对它的泛化能力表示存疑。半年前自己也试过类似的方法,不过不起作用,不理解为什么在苹果的试验中起了作用。同时很奇怪为什么这篇论文能评为最佳论文。

南洋理工大学一位研究手势识别的计算机视觉博士评价苹果论文说道:

苹果SimGANs的手势识别效果并不好,还没有自己做的模型效果好。

另一位MIT生物图像博士:

感觉SimGANs并不是很有意义(not very meaningful),相比其他方法并没有很大的提升。

不过也有AI学界人士支持苹果获最佳论文,一位亚马逊研究员告诉记者:

SimGANs 很简单。但也开了一个新口子,针对一个具体问题有了新方法,未来其他人可以研究如何把类似方法用到其他领域,算是“抛砖引玉”。另外,由于该方法的特殊性,需要做许多工作才能用于某一领域,因此确实难以在一个研究中提出一个通用方案,解决一个具体问题已经可以了。

来自国内的一位中科院教授说道:

SimGANs 论文第一作者 Ashish Shrivastava 的导师是 CVPR 大会主席 Rama Chellappa,算是“举贤不避亲”(意思是只要是真正有本领的贤能人才,不管与举荐人是否有关系,都可以正常举荐,让贤能的人才发挥其作用。)雷锋网(公众号:雷锋网)记者也跟其他参会的学生老师提了这个疑问,很多人认为论文评审流程严格,未必有多大不公平。

最后采访的几位大牛总结了一下今年的两篇最佳论文:这两篇论文没什么理论突破,只是技术上的提升改进。同时也表示,今年的CVPR创新突破已经很少,差不多都是在原有的基础上有一点点提升。

雷锋网小结

三位反对苹果获最佳论文的统一看法是:苹果SimGANs的泛化能力差,只能用到具体的某个领域。另外单从表现效果上看,和其他方法相比也没有很大的提升。两位支持者看法是:由于SimGANs方法的特殊性,确实难以形成一个通用方案,不过苹果给出了一个新思路,能启发大家就够了。

这届CVPR总体来说没有学术界期待的那种划时代的研究成果出现,苹果论文之所以不那么出色也能从中脱颖而出,恐怕不是苹果“有关系”,而是“矮子里面选高个”的原因吧!



读者福利


IBM 日前内部分享了AI /认知计算、云计算、区块链、物联网以及对话机器人领域的趋势报告,从这些报告或许能给在在这些领域苦苦探索的你一些灵感。关注雷锋网微信(leiphone-sz),输入 “0629” 获得报告原文。


  ● 



近期热门文章


我试驾了特斯拉 Model 3,这几个知识点你需要知道

兵贵神速,雷军趁出货量新高发起线下攻防战

凭阿里和腾讯实力,怎么今年才进世界500强?

国务院规划了新一代人工智能战略:2030年带动10万亿产业规模

烧光十亿清算离场,Jawbone 究竟是天作孽还是自作死?

联手诺基亚,雷军的千亿美金梦想又回来了

苹果中国的领导层,比预料中的更有故事