今天,AI界迎来了一场盛事。
创新工场、搜狗和今日头条三家国内人工智能领域领军企业聚在一起,携手发起了“AI Challenger全球AI挑战赛”,面向全球AI科研人才广发英雄帖,参与人体骨骼关键点检测等五项AI技术比赛。
主办方为首届竞赛准备了200万元人民币的奖金,供参赛优秀选手分享。参赛选手还有机会进入三家主办方工作、实习或获得投资,并有机会获得十余位人工智能领域顶级专家评委的指导和评价。
此外,主办方还决定将超过1000万条中英文翻译数据、70万个人体动作分析标注数据、30万张图片场景标注和语义描述数据公开。这是国内迄今公开的规模最大的科研数据集。
创新工场创始人兼CEO、创新工场人工智能工程院院长李开复,搜狗CEO王小川,今日头条顾问、技术战略研究院院长张宏江等人出席了今天的发布会。
李开复在致辞中说, AI Challenger不仅仅是一个奖金200万的竞赛活动,评选结果出来就结束了。这是推进中国AI人才成长的催化剂。三五年后我们再回顾,如果中美AI人才的落差消失了,希望我们会想到AI Challenger在这样重大过程中扮演的一个小小角色。
竞赛面向社会,即日起开始报名。参赛选手可以登入活动官网challenger.ai,了解比赛信息、评选细节,并完成个人信息实名验证。9月4日,大赛将开放训练数据集以及验证数据集,参赛选手可以自行下载数据。总决赛巅峰对决将在12月中旬举行。
AI Challenger全球挑战赛启动视频
一、AI Challenger挑战赛是什么?
“AI Challenger全球AI挑战赛” 是一个非商业化的竞赛平台,面向人工智能领域科研人才,致力于打造大型、全面的科研数据集与世界级竞赛平台。
大赛由创新工场、搜狗、今日头条联合发起,旨在从科研角度出发,满足学术界对高质量数据集的需求,推进人工智能在科研与商业领域的结合,促进世界范围内人工智能研发人员共同探索前沿领域的技术突破及应用创新。
2017年首届AI Challenger将区分为五个竞赛任务供参赛者组队报名,包括:人体骨骼关键点检测竞赛、图像中文描述竞赛、场景分类竞赛、英中机器文本翻译竞赛、英中机器同声传译竞赛。
大赛面向全社会开放,个人、高等院校、科研单位、互联网企业、创客团队等人员均可报名参赛。创新工场、搜狗、今日头条现任全职及兼职员工,数据集建立及维护过程中能接触到数据的人员不得参赛。
2017年首届竞赛即日起开始报名,参赛队伍可1-3人组队,所有选手必须完成个人信息实名认证(登入challenger.ai官网)。9月4日,大赛将开放训练数据集以及验证数据集,参赛选手可以自行下载数据。此后,各路高手将展开为期三个月的比拼,并于今年12月中旬进行总决赛巅峰对决。
首届竞赛设有共计200万元人民币的奖金池,供参赛的优秀选手分享。此外,他们还将获得进入三家主办方工作、实习或获得投资的机会,并有机会在国际顶级学术会议上分享获奖心得,得到如上海科技大学教授马毅、旷视科技首席科学家孙剑、前Google研究院高级管理科学家林德康等十余位人工智能领域顶级专家评委的指导和评价。
二、为什么要发起AI Challenger?
在人工智能领域,数据的质和量是科学研究与产品技术研发的核心。高质量训练数据对机器学习模型的建立和优化有关键性的作用。建立大规模、高水准的标注数据集,是推动AI科研和技术前进的驱动力。
创新工场、搜狗、今日头条三方都认为,数据、算法、计算能力是人工智能的三大基石,其中,数据更是人工智能科研最宝贵的资产。没有足够好的数据,就无法取得世界顶级的科研成果。在此方面,学术界和创业团队所能获得的数据资源通常远少于产业界中的顶级企业。因此,将高质量的数据集建设与科学研究、技术产品研发、人才培养有效结合,对人工智能发展具有重大意义,也是身为产业先驱应尽的一份社会责任。
对于发起本次合作,创新工场创始人兼CEO、创新工场人工智能工程院院长李开复说:
在30多年前自己作为AI科研人员的时代,能接触到真实世界的海量数据是个遥不可及的梦想。如今,伴随互联网和移动互联网而来的大数据、高效的计算机运算能力等条件都齐备的环境下,有了AI Challenger这样的开放数据集和竞赛平台对于AI科研与开发人员是个难得的契机。AI Challenger致力于解决数据集缺失的问题,为人工智能科研免费提供海量数据,辅以强大的学术界和产业界专家指导,全力支持国内外的高校、研究机构、产业界科研人才一起来挑战人工智能的未来可能性。
AI Challenger也是对国际知名AI竞赛的致敬和延续。上月,举办了八届的ImageNet挑战赛由创始人之一李飞飞博士正式宣布退出历史舞台。国际上,ImageNet挑战赛曾是每年企业和研究者都极为看重的活动。另一机器学习竞赛平台Kaggle着眼于真实数据和真实问题的解决方案,同样吸引了全球将近百万数据科学家和研究者进行挑战和探索其多元化的公开数据集。
三、主办方能提供什么?
2017年是AI Challenger的诞生年,创新工场、搜狗、今日头条三方将开放百万量级的计算机视觉数据集、千万量级的机器翻译数据集,并主办多条细分赛道的AI竞赛。
将开放的数据集包括:超过1000万条中英文翻译数据(用于同声传译等自然语言处理的各类应用)、70万个人体动作分析标注数据(用于无人驾驶、安防、体感游戏等场景)、30万张图片场景标注和语义描述数据(用于图像和视频内容理解、图像标题自动生成等各类应用)。这是国内迄今公开的规模最大的科研数据集。
未来三年,AI Challenger将投入数千万启动基金,解决数据集缺失的问题,为人工智能科研提供海量数据及算法竞赛、人才交流平台,辅以强大的学术界和产业界专家指导,全力支持与帮助国内外的高校、研究机构、产业界的研发团队。
三个主办方将持续投入,建设和发布更大规模的AI前沿领域高质量数据集,涵盖自动驾驶、智慧医疗、智慧金融、机器人等行业应用中的核心AI需求,主办世界级的年度AI竞赛,吸引世界范围内的高端AI研发人才,促进人工智能科研生态的持续健康发展。
四、凭什么能创建此次世界级大赛?
创新工场、搜狗与今日头条是国内最专注于人工智能领域的三家公司。创新工场作为业内最早在人工智能领域布局的投资机构之一,在2016年下旬成立了人工智能工程院,积极推动AI的研究与技术朝向产业实践转化。
搜狗是最先将人工智能技术应用落地的互联网公司,语音、图像识别、自然语言理解、机器翻译等技术均已应用于搜狗相关产品当中,包括搜狗搜索、输入法、机器同传等产品,在产业实践中积累了大量语音、文本、图像、视频等数据集,同时沉淀了深厚的计算机视觉、自然语言理解、数据挖掘等方面的技术能量。
搜狗CEO王小川表示:
人工智能本质是建立在大数据和机器学习的基础之上。目前,搜狗以语言为核心的人工智能技术,已经通过问答、语音和翻译等形态应用于搜狗搜索和输入法等诸多产品中,并积累了大量的用户与数据规模。其中搜狗的语音输入日频次已达2.6亿次;搜狗的实时机器翻译技术也在包括乌镇世界互联网大会等数百场会议上进行了落地应用。我们希望能够利用搜狗的优质数据和应用场景助力AI Challenger全球AI挑战赛,让全球科研工作者取得更大的成就与突破,一起推动人工智能行业更快、更好地发展。
今日头条同样是最早一批将人工智能技术应用于产品的公司,也是把算法、工程、产品、运营在人工智能应用层面结合得最好的一家公司,在产业实践中积累了大量文本、图像、视频等数据集,并沉淀了深厚的计算机视觉、自然语言理解、数据挖掘等方面的技术能量。
今日头条顾问、技术战略研究院院长张宏江表示:
依托大数据和人工智能技术,今日头条希望实现更高效的信息流动。身处人工智能行业,我们深知,人才和数据是整个行业的未来。这次头条与搜狗、创新工场联合举办AI Challenger挑战赛的初衷,就是希望通过开放数据,吸引更多优秀人才参与到算法模型的开发、设计中来。比赛结束后,所有数据集会向社会全面开放,我们希望尽一些微薄的力量,为学术界、学术人才提供帮助,加强产学研结合,共同推动中国人工智能行业的发展。
挑战赛详情请点击“阅读原文”
转自:创新工场