国际人工智能联合会议(International Joint Conference on Artificial Intelligence,IJCAI)是聚集人工智能领域研究者和从业者的盛会,也是人工智能领域中最好的综合性学术会议之一。该大会的主办方是位于美国加利福尼亚州的非营利性组织 IJCAI, Inc.。前段时间,被誉为国际人工智能领域「菲尔兹奖」的 IJCAI 大会计算机和思想奖(Computers and Thought Award)花落女性科学家——乔治亚理工学院交互计算学院助理教授 Devi Parikh。今天,IJCAI-17 其他奖项也陆续出炉,让我们一睹为快。
IJCAI -17 奖项
IJCAI -17 优秀科研奖(Award for Research Excellence)、约翰·麦卡锡奖(the John McCarthy Award)、计算机与思想奖(the Computers and Thought Award)由 IJCAI 理事会根据奖项评定委员会的推荐评定颁发,本届的委员会成员有:
-
Craig Boutilier,来自(加拿大)多伦多大学与(美国)谷歌
-
Yolanda Gil,(美国)南加利福尼亚大学
-
Joelle Pineau,(加拿大)麦克吉尔大学
-
Francesca Rossi,(意大利)帕多瓦大学
-
杨强,(中国香港)香港科技大学
IJCAI 奖项评定委员会(Awards Selection Committee)接收来自奖项审查委员会(Awards Review Committee)的建议,后者就提名材料的精确性发表意见,并提供有关被提名人的额外信息。IJCAI-17 的奖项审查委员会成员包括上届 IJCAI 理事会、 IJCAI-17 咨询委员会、最近三届 IJCAI 会议的执行主席(the Program Chairs)、往届 IJCAI 优秀科研奖和杰出贡献奖获得者以及被提名人。
IJCAI-17 优秀科研奖
优秀科研奖通常授予研究项目一贯高质量并且成果丰硕的科学家。今年,该奖项获得者是马萨诸塞大学阿默斯特分校计算机科学与信息学院荣誉教授、自主学习实验室(Autonomous Learning Laboratory )联合负责人 Andrew Barto,以表彰其在强化学习理论与应用领域做出的开创性且颇具影响力的研究。他也是强化学习专家 Rich Sutton 的博士导师。
我的研究关注的是机器和动物的学习行为。我已经研发出一些既对工程应用有用,也与心理学家、神经科学家研究的学习行为有关的学习算法。我不敢说自己是心理学家或者神经科学家,但确实花了大量时间阅读这些研究领域的文献。我深刻地感受到自己的研究应该尽可能与诸多相关领域最新研究紧密融合起来。理解这些新的研究进展与过往研究的关系,也很重要。
就强化学习而言——该领域的主要思想可追溯久远——非常可喜的是研究人员正在将强化学习与源自随机最优控制理论(stochastic optimal control)的方法联系起来。特别让我感觉兴奋的是,研究正在将时间差分(TD)算法与大脑多巴胺系统联系起来。这也是我重新有兴趣将强化学习视为打造和理解自主智能体解决方案的部分原因。
最近我的大部分工作是扩展强化学习方法以使其实时地运行于真实环境之中,而不是像现在很多最令人印象深刻的应用那样仅仅在模拟环境之中运行。目前,我对心理学家所说的内在动机行为(intrinsically motivated behavior)尤其感兴趣,这种行为有其内在目的,它不是为了解决某一具有明显实际价值的特定问题。我们从内在动机行为中学到的东西对我们的研发工作很关键,因为称职的自主体(competent autonomous entities)能够解决许多不同实际问题。最近,我同事和我就是在研究内在动机强化学习(intrinsically motivated reinforcement learning),旨在让人工智能体能够建构和扩展可重复使用技能的层级结构,这也是开放式学习的基础。更多细节,请移步自主学习实验室网站。
过去,该奖项的获得者都是人工智能领域最杰出的科学家们。比如,IJCAI 2016 优秀科研奖的获得者是加州大学伯克利分校 EECS 系陈丕宏、杰出教授 Michael I. Jordan。曾经获得 IJCAI 优秀科研奖的科学家包括 John McCarthy(1985)、Allen Newell(1989)、Marvin Minsky(1991)等。
IJCAI-17 计算机与思想奖