本文
约
5400字
,建议阅读
10+分钟
。
中国人工智能学术界首次“华人顶会主席圆桌”。
[ 导读 ]
7月12日- 7月14日,
2019第四届全球人工智能与机器人峰会(CCF-GAIR 2019)
于深圳正式召开。
峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,深圳市人工智能与机器人研究院协办,得到了深圳市政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流博览盛会,旨在打造国内人工智能领域极具实力的跨界交流合作平台。
7 月 12 日,中国人工智能学术界首次公开举办了“华人顶会主席圆桌”。五大国际 AI 顶会华人主席分别就各自领域会议的文章水平、大会主题和形式等方面相关变化的观察分享了相关观点,该圆桌论坛主持人由京东集团副总裁郑宇担任。
出席本次圆桌论坛的嘉宾有:
-
马颂德,原科技部副部长、欧美同学会副会长、ICCV 2005 大会主席;
-
张正友,腾讯 AI Lab & Robotics X 主任、CVPR 2017 大会主席;
-
周明,微软亚洲研究院副院长,国际计算语言学会(ACL)主席;
-
杨强,香港科技大学讲席教授、微众银行首席 AI 官、IJCAI 理事会主席;
-
陈义明;新加坡工程院院士、南洋理工大学教授、ICRA 2017 大会主席。
中国人工智能四十年 • 华人顶会主席圆桌
以下是圆桌会议的全部精彩内容,我们做了不变原意的整理与编辑:
一、顶会现状,一场过去与现在的思维碰撞
郑宇:
近几年,各大顶会里面的文章水平、大会主题以及形式有发生哪些变化?
尤其是现在相对 10 年前,我们的论文水平、学者参会情况上发生了哪些明显的变化?
周明:
这是一个值得探讨的好问题,现在的 ACL 的文章主要有这样的特点——聚焦大数据驱动、神经网络方面的内容,所以文章的技术水平很高;但内容都千篇一律。20 年前大家是基于规则的,语言学规则大家有各自的想法,那时是皓首穷经要写上万条规则,所以 20 年前的文章,个性化更强,在研究方面所下的功夫会比现在更深。
现在是一个好的时代,但是我们更应该用开放的心胸看待历史,充分尊重前辈的工作,从而找到未来新的增长点,即不要拘泥于现在所谓的“深度学习方法”,也应该考虑到人类知识和大数据以及人的各种因素,将其糅合在一起,从而开创一个新的时代。
马颂德:
回顾这些会议这么多年来“想解决什么问题、在做什么努力”会对今后很有用。因为我们可能会碰到类似的问题,就可以有类似的解决办法。而反观这些年计算机视觉方面包括 ICPR、ICCV 做的事情可以发现,虽然我们想构筑一个人工智能计算系统或者计算机视觉系统,但这些年的文章、讨论的问题却是在努力寻求突破,而这些内容的本质就是加知识。当然现在计算机视觉领域也有许多做的东西可能方向不太对,但所做的很多努力是能结合今后需要再继续深入研究下去的。
郑宇:
ICCV 和 CVPR 有没有区别?
有多大区别?
张正友:
两者有很大的区别。从频率来讲,ICCV 两年一届,CVPR 一年一届;从规模来讲,我第一次参加 ICCV,规模是两百多人,那时 CVPR 也差不多两三百人,而今年 CVPR 已经达到了九千多人参会;从内容来讲,ICCV 更偏向理论的,更有指导性的工作;CVPR 是更偏向于应用方向的研究;所以 ICCV 的门槛要比 CVPR 更高。
而近年来,会议的一个很大变化是中国人的参会比例。今年 CVPR 的会议,华人投稿比例达到 40%,参会华人估计超过 50%,华人在计算机视觉这个领域参会的人数非常多。除了门槛原因,这也侧面反映中国人掌握应用技术的能力是相当强的;但也希望我们今后的发展,可以更多往原创性方向努力。
郑宇:
IJCAI 和 AAAI 有没有什么独立存在的意义?
AAAI 与 KDD 的变化以及两者的联系是什么?
杨强:
IJCAI 从 1959 年走到今天也犯了很多错误,这些错误既对我们有教育意义,也反映了人工智能走的一些弯路。人工智能一开始追求的是比较高级的智能,比如:推理、证明定理、下棋,所以有很多这方面的人工智能的研究;但是它却忘记直接让机器去接触这些最原始的数据。所以现今 NLP 大火则告诉我们,不要追求那些看上去高大上的内容而忘记基础。其次,因为 IJCAI 追求这些高级智能,所以一开始 IJCAI 就决定了哪些方面不是 AI,并拒收该类论文。但今天这些拒收领域的参会人数比 IJCAI 更多,包括 CVPR、ICCV 等等的会议就是在这个基础上建立的。尽管这些会议各自蓬勃发展,但会延迟整个人工智能的发展,甚至对这些单独的领域起到延迟作用。
而谈到 AAAI 和 IJCAI,首先 AAAI 的历史是来自美国人工智能的,它是以美国人为主所建立的,至今没有出过北美,只去过一次加拿大。但是 IJCAI 由世界轮流举办,所以每次开会都有一天时间是各国的人工智能学会,大家一起讨论各国的人工智能发展,只是很可惜每次中国人工智能学会都没有参加,也希望这一点在未来能有所改变。
至于 KDD,它本身是由数据库那个方向发展过来的,它里面汇聚了很多数据库的人士,专注于数据科学这个方向;和 AlphaGo、无人车这些全自动驱动的人工智能还是有一定的区别。
郑宇:
关于 ICRA 会议,有什么变化?
陈义明:
ICRA 是从 1984 年开始的,至今已有 35 年的历史。这个会议过去是偏理论为主,但近 10 年来开始偏向应用方面,并且参会人员也从只有学校和研究单位,逐渐加入了越来越多的公司。但不管哪个行业应用,针对机器人领域来说,最重要的就是落地。
既然是一个应用学问,它会跟整个技术发展有一连串相关关系。最早机器人跟随汽车业,中国的机器人起源也都是跟汽车工业有关。之后才开始有了移动机器人、医疗机器人等等,所以从它的内容来讲,也主要与时代热点相关。2000 年左右,因为本田推出双足机器人,所以那段时间双足机器人的文章就非常多。在前三五年无人机比较热门,所以无人机的文章就非常多。一直到最近这两年,大家都要用深度学习,很多人就一定要用深度学习来做工业机器人、无人机等等。但最重点是可以从中看出,现在大家对这个应用越来越重视,尤其是落地行业的应用。
郑宇:
这些会议最近一届参会人数是多少?
周明:
ACL 去年是 2000 多人,今年大概会突破到 2500 至 3000 人。
张正友:
CVPR 今年有 9000 人。
杨强:
IJCAI-18是作为Federated AI Meeting的一部分召开的,包含同期联合举行的AAMAS,ICML,ICCBR和SoCS的会议,一共有7000多人参会。
陈义明:
ICRA 今年刚在加拿大蒙特利尔办的,大概有 4000 人。
二、新会迅速崛起,是挑战还是机遇?
郑宇:
NeurIPS 最近参会人数有 1 万多,这个会议为什么能崛起?
背后有什么样的原因?
这些现象说明了什么?
周明:
其实 ACL 最近提交论文数量也是爆增,主要原因我认为有四点。第一,现在数据集太多,几乎每年都会新增几个数据集;第二,方法层出不穷;第三,博士生毕业需要撰写相应的论文;第四,被拒论文流于各个会议,所以每个会都会承接部分相同的论文。但总体来讲,现在的会议都特别相似,所以会议规模太大并非好事,因为大家都从众来做这些事。相反,我更倾向于一个小而精的会议,这样的会更容易让大家坐在一起深入讨论一些方法。
张正友:
CVPR 2017 年的时候是 5000 人,今年是 9000 人,假如按照这样的曲线发展,会议量将非常大。我们去开会没有时间听报告,更多是见见老朋友,朋友之间聊聊互相做的事情,所以现在参加会议目的已经很不一样了。真正要做学术,正如周明所说,还是在小会议、闭门会议聊得会深入些。
陈义明:
ICRA 是机器人领域最大的会议,它基本上是一支独大,规模也在成长;但毕竟学者总数还不多,因此成长空间有限。现状是很多小会依附于大会,然后大家在大会上见老朋友,在这些小会上讨论详细的领域,所以现在大小会的交叉融合,我认为是一个生态的演化。
郑宇:
NeurIPS 的火热程度与深度学习的爆发和应用有很大的关系,但深度学习是不是也会遇到寒冬呢?
杨强:
我觉得“深度学习热”是有原因的,因为之前我们主要是从逻辑的角度来做的人工智能,知识的方法根据规则而来,并没有考虑人的大脑结构。但现在发现人是一个鲁棒性非常强的分布式的知识表达,在这种知识表达的思想下设计出来的机器虽然不一定是深度学习的表达,但是它确实是当前最有代表性的。我觉得再往下应该沿着这个方向继续走下去,不一定是接着深挖现在有的神经网络式深度学习,也许还有其它的秉承这种分布式的思想,并且具有高鲁棒性、高并行,能够做知识的非线性转化的方法。所以在这一领域,我们还有很多的路要走。
三、聚焦 AI 大势,学界、业界何解?
郑宇:
深度学习在自然语言处理这个领域里面,其重要性和未来的前景如何?
现在学生应该花更多精力在深度学习,还是应该反思之前的方法?
周明:
我有两个打引号的著名观点,第一个观点是要“与时俱进”,即在你还对这个领域不太了解之前,就先跟随别人。第二个观点是“挑战权威”,即在已经了解这个行业的情况下,提出独到的观点,实现超越。人在任意时刻都是这两个矛盾的有机统一,不同时刻要有不同取舍。
张正友:
深度学习的成就还是有目共睹的,无论是在计算机视觉、语音识别还是在 NLP 方面都有很大的进展,深度学习可能会成为一个工具。对每个学生来讲,是需要花时间去了解这个工具的;而之后的发展则要根据个人兴趣。有些学生目的不是要做研究,可能需要掌握深度学习,因为目前在工业界最有用的工具可能就是深度学习;但如果要做研究,那么你去深入思考深度学习背后的一些问题,然后进行创新,可能会更好。
郑宇:
在学界和在工业界做人工智能,各有什么样的利弊以及优势与劣势,特别是从学界到工业界,最大的变化和挑战是什么?
杨强:
我在学术界往往是深挖一个东西,持续做 10 年、20 年。迁移学习我做了 20 多年,最后写出一本书,这是在学术界的做法。而在工业界就是发现问题,比如在工业界我就发现公司和公司之间、部门和部门之间数据不通,即部门墙。很多人就认为 AI 没法做,但我认为这是机会,所以我尝试在保护数据隐私的情况下,打破部门墙。这是到了工业界才发现的问题。
张正友:
工业界和学术界确实是很不一样的,学术界在现在这个大数据时代往往拿不到大数据,只能在相对较小的数据里面做研究,最终效果可能很好,但到工业界要在实际中应用,你会发现很多问题;在学术界可能你会专注于写文章、发表,但是在工业界则是把重要的问题都解决掉,其中可能不光是一个问题;在学术界可能你喜欢某一个方法,你就沿着这个方法深挖、钻研,这个问题本身可能没有实际应用,但在工业界则是以问题为出发点,有哪些重要的问题,那么我们就需要想办法来解决这个问题。
郑宇:
请马老师说一下学术界的优势,之前有个观点说好像工业界把学界的人挖得差不多了。
马颂德:
因为人工智能很火,学生毕业后假如还留在一般的研究机构,可能收入会和工业界差很多倍。现在可能我们不需要这么多研究,所以有很多人转到工业界,国际上也是这样,很多人进入了工业界的研究所,这是正常现象。我们不太能说清学术界在基础研究方面能够提出很多有价值的问题或者在近期可以做出重要的突破,但我们仍然需要研究,它是必须的,也是应该的,只是它的队伍的稳定或者价值观等,还需要大家来共同努力。