2006年,李飞飞开始反复思考一个想法。
当时刚刚成为伊利诺伊大学厄巴纳-香槟分校(UIUC)计算机科学教授的她发现,自己在人工智能学术界和产业界的同侪都在同一个概念的指导下苦心专研:更好的算法能够做出更好的决策,而数据并不重要。
但李飞飞意识到了这种观念的局限性:如果算法用来学习的数据没有反映现实世界的状况,那么即便是最好的算法也无法发挥作用。
她的解决方案是:创建一个更好的数据集。
“我们决定要做一些绝对史无前例的事情。”李飞飞说道,这个“我们”,指的是最初跟自己共事的小团队,“我们要标注出由对象构成的整个世界。”
这个想法最后造就了一个名叫ImageNet的数据集。该研究成果在2009年以学术海报的形式被首次公之于众,它被张贴在迈阿密海滩一处会议中心的角落里。
很快,ImageNet发展成为一场年度比赛,要看一看哪种算法能够以最低的错误率识别出数据集图片中的对象。很多人认为,ImageNet正是当今这轮人工智能热潮的催化剂。
ImageNet挑战赛发展到后来,参赛者遍布科技世界的每个角落。2010年首届比赛的优胜者如今都已在百度、谷歌和华为担任高级职务。
马修·泽勒(Matthew Zeiler)基于自己赢得2013年比赛的作品创建了Clarifai公司,并拿到4,000万美元风投。2014年,谷歌跟来自英国牛津大学的两位研究人员共同折桂,这两人很快被谷歌招入麾下,加入了该公司新近收购的DeepMind实验室。
目前,李飞飞本人是谷歌云(Google Cloud)的首席科学家,斯坦福大学的教授,并同时担任该大学人工智能实验室的主任。
周三,她登上CVPR大会的舞台,最后一次介绍了ImageNet挑战赛的年度结果——2017年是该比赛的最后一年。在短短7年时间里,优胜者识别数据集对象的准确率从71.8%上升到了97.3%,超越了人类的能力;同时有效地证明,更多的数据能够让算法做出更好的决策。