AI 科技评论按:截至发稿前,四篇荣获 CVPR 2017 最佳论文的作者已经分别做了口头报告,而在到场聆听报告的所有人当中,有一位略显特别的听众——他便是本届 CVPR 的大会主席、微软研究院首席研究员张正友博士。在报告结束后,张正友主席与 AI 科技评论进行了一次对话。
张正友,ACM Fellow (国际计算机学会院士)和 IEEE Fellow (国际电气电子工程师学会院士),是微软人工智能及研究事业部首席研究员和研究经理,加入微软美国本部已近二十年。1990年获得巴黎第十一大学博士学位,在法国国家计算机和自动化研究院(INRIA)学习工作近十二年。张正友博士是世界著名的计算机视觉和多媒体技术的专家,在立体视觉、三维重建、运动分析、图像配准、摄像机自标定、人脸表情识别等方面都有开创性的贡献。他发明的平板摄像机标定法在全世界被普遍采用,被称之为“张氏方法”。
与密切关注论文颁奖结果的老师同学们不一样的是,张正友博士对「最佳论文」并没有那么看重。他认为,这与论文所产生的影响力(impact)并不能同一而论。「我们可以回看过去十年 CVPR 或是 ICCV 的最佳论文,几乎没有一篇能获得 test of time award,」张正友博士表示,每年的最佳论文很大程度是由当年的热门选题决定的,虽然由资深的教授和研究员担纲评估,但毕竟是少数几个人的看法。这些论文虽然都是很不错的论文,但多年以后,它们的引用次数不一定是最高的,也不一定能「经得起时间考验」,获得像 Longuet-Higgins 这样的奖项。
正如今年的 Longuet-Higgins 所授予的 Test of Time 论文《Object Retrieval with Large Vocabularies and Fast Spatial Matching》一样,当年的最佳论文并不归属于它。而张正友博士的亲身经历同样是最好的例证——凭借 1999 年在 ICCV 上发表的关于摄像机标定的文章《Flexible Camera Calibration by Viewing a Plane from Unknown Orientations》及后续在 IEEE T-PAMI 上发表的文章《A Flexible New Technique for Camera Calibration》,张正友博士在 2013 年荣获由 IEEE 模式分析与机器智能技术委员会(PAMI TC)授予的 Helmholtz Test of Time 奖。值得一提的是,当年他将这篇 ICCV 论文投递给 CVPR,却没被录用。
「要静得下心,要沉得住气,」是张正友博士在 IJCV Lobster Night 上演讲的中心思想。而他自己的研究工作,也严格遵循着这一原则。从 1988 年到 2002 年,14 年来,张正友博士一直按着每两年选择一个课题的节奏,对业界重要的问题进行深入细致的研究,而他每两年的研究成果几乎每个都在计算机视觉界产生了比较大的影响。同时,张正友博士也评论道,他个人并不反对学生对热点话题(hot topic)的关注,也理解他们有着每年多出几篇文章的压力,但希望他们能从行业的真正需求出发,将目光放得长远一些。
作为过来人,张正友博士感慨道,如今的学生与以前的学习方式迥乎不同。以前由于条件限制,学生的每一行代码都需要自己从头开始编写,但也正因为这样,学生对推导的每一步都非常了解,基础也相对扎实;而如今互联网资源非常丰富,学生往往没有花足够的时间理解算法背后的原理,也没有耐心关注基础问题的研究。
「我觉得同学们没有必要为了多发表几篇文章而牺牲了思考这些问题的机会。虽然能在热点研究领域做些改进使其在数据集上呈现比较好的结果,发表文章相对容易,但像深度学习这样的热点总会过去。如果没有独到的贡献,明年还有人知道你的工作吗?」
时光荏苒,曾经作为论文投递者和会议参与者的张正友博士,如今已经成为了 CVPR 2017 的大会主席,以重要推动者的身份组织着本次大会。根据本次大会的官方资料,CVPR 2017 的与会人数达到 4950 人,达到了历史高峰;本次论文有效投递数为 2620 篇,收录 783 篇,投递数目比去年增加了40%。
自然,这对于会务的组织者而言是一个不小的挑战:由于投递的论文数量过多,为了在规定时间内完成评审任务,组委会不得不紧急增加一些评审人;针对去年CVPR因为人数剧增暴露出的后勤保障混乱、中间休息的咖啡不足、展会和 posters 空间拥挤等问题,组委会为这次 CVPR 做了很长的准备,在会议中心预留了6000人的空间,并雇佣了一个专业的支持展会的承包商。组委会齐心协力办一场出色的 CVPR,不仅是为了促进计算机视觉领域在人工智能领域的交流;也是一次 CV 圈展现自我的机会。虽然参加 CVPR 的人数从去年的 3650 人增加到了今年的 4950 人,但整个会议进展非常顺畅,大家的反馈也非常满意。
而在这次会议中,AI 科技评论的一个明显感受是华人面孔非常多;关于这一点,张正友博士表示,由于今年自己担任大会主席,刘燕西博士和吴郢博士担任程序委员会主席,因此在区域主席的选择上,也有意识地增加了华人的比重,希望能够提升华人在学术领域的影响力。在组委会的其它位置,比如企业关系主席,也尽可能安排能干的华人担任。就像吴郢博士在 IJCV Lobster Night 上的发言所说,大部分的论文作者中,至少会出现一个亚洲名字;口头报告中涌现越来越多的亚洲面孔;而赞助商也有很多来自亚洲国家。中国作为亚洲的重要大国,华人自然也是这一群体的中坚力量。
然而,张正友博士也发现,虽然华人在学术会议里的地位和力量不可小视,但当这些优秀的华人学生毕业之后,能留在学术界持续做贡献的人并不多,很多会转投工业界继续做研究或是创业。以往计算机视觉的学生很难找到工作,而现在,随着它的持续发展繁荣,学生们也成为了工业界关注和争夺的对象,投身工业界也成为了顺理成章的事情。以 CVPR 2017 为例,本届会议的赞助商达到 127 家,总赞助费超过 85.9 万美金。这也从侧面体现出了工业界对学术人才的庞大需求。不过张正友博士也认为,这种「流失」实际上也与个人的选择有关,「做研究的目的,一方面是为了增加人类的知识,发掘新的方法;另一个还是要对社会产生影响,在工业界工作算得上是其中一种方式吧。」
张正友博士对计算机视觉的未来充满了信心,也呈现非常乐观的态度。他认为,无论从论文的投递数目,还是展商对学术会议的高度关注来看,都反映出计算机视觉是一个非常具有前景的领域。「深度学习也不只是大数据的游戏,有人已经开始研究如何将深度学习和几何概念和物理信息结合。此外,计算机视觉也已经与很多领域有了交叉,比如为了理解图像,我们需要结合语言进行处理。而在未来,各个学科会以更加多样化的形式融合。」同样地,未来属于富有创新力量的老师和同学们,未来的研究趋势和浪潮,将由他们来引领和推动。
今天,CVPR 2017 已经进入尾声,我们也期待下一年的 CVPR 能够给我们带来更多惊喜。更多资讯,敬请关注 CVPR,关注 AI 科技评论。
———————— 给爱学习的你的福利 ————————
CCF-ADL在线讲习班 第80期:区块链—从技术到应用
顶级学术阵容,50+学术大牛
快速学习区块链内涵,了解区块链技术实现方法
课程链接:http://www.mooc.ai/course/113
或点击文末阅读原文
——————————————————————————