专栏名称: PaperWeekly

PaperWeekly是一个分享知识和交流学问的学术组织，关注的领域是自然语言处理的各个方向。我们热爱知识，分享知识，希望通过我们大家的努力为自然语言处理的发展做出一点点贡献。我们每周会分享一期特定话题的论文笔记和本周值得读的相关论文。

活动推荐 | 第一届“讯飞杯”中文机器阅读理解评测（CMRC2017）

PaperWeekly · 公众号 · 科研 · 2017-04-08 09:05

正文

欢迎来到第一届“讯飞杯”中文机器阅读理解评测（The 1st Evaluation Workshop on Chinese Machine Reading Comprehension）！

“第十六届全国计算语言学学术会议”（The Sixteenth China National Conference on Computational Linguistics, CCL 2017）将于 2017 年 10 月 13 日—15 日在南京师范大学举行。作为国内最大的自然语言处理专家学者的社团组织——中国中文信息学会（CIPS）的旗舰会议，全国计算语言学会议从 1991 年开始每两年举办一次，从 2013 年开始每年举办一次，经过 20 余年的发展历程，已形成了十分广泛的学术影响，成为国内自然语言处理领域权威性最高、口碑最好、规模最大（2016 年注册参会人数超过 600 人）的学术会议。CCL 着重于中国境内各类语言的计算处理，为研讨和传播计算语言学最新的学术和技术成果提供了高水平的深入交流平台。

从今年的 CCL 会议开始，我们计划同步举办评测活动。本次我们聚焦的任务是机器阅读理解（Machine Reading Comprehension）。让机器能听会说，能理解会思考是人工智能的长远目标。机器阅读理解作为目前自然语言处理领域中的热门研究内容受到了广泛关注。与传统的问答系统不同的是阅读理解任务更注重于对于篇章的理解，而不是利用世界知识、常识来回答问题，所以更具有挑战性。因此阅读理解受到了各大研究机构的高度重视，并且纷纷投入到相关研究当中，其中包括 Google DeepMind, Facebook AI Lab, IBM Watson, 斯坦福大学（Stanford）, 卡内基梅隆大学（CMU）等。

本届中文机器阅读理解评测由中国中文信息学会计算语言学专委会主办，哈工大讯飞联合实验室（HFL）承办，旨在促进中文阅读理解研究及发展并且为相关领域学者提供一个良好的沟通平台。在此，评测会务组诚邀各个单位参加本次评测活动！

评测内容

任务概述

本次阅读理解评测的任务是“填空型阅读理解”（Cloze-style Reading Comprehension），参赛者需要对给定的篇章进行分析并回答与篇章相关的填空型问题。

具体形式如下：

评测方向

本届阅读理解方向主要面向“儿童读物”领域。

与传统的新闻领域不同的是儿童读物领域的内容与新闻领域相差较大，篇章中包含较多拟人化的动植物且文本之间的风格相差较大，更具有挑战性。

同时根据问题的形式，又分为如下两个方向（Track），参赛者可以任选其一或者同时参加。

但需要注意：两个 Track 共用一个训练集（填空型问题），所以参加用户提问型问题的参赛者需要考虑填空型问题到用户提问型问题如何进行迁移学习。

1）填空型问题

篇章：由若干个连续的句子组成的一个文本段落，但文中缺少某一个词 XXXXX
问题：缺少的词 XXXXX 所在的句子
答案：缺少的词 XXXXX

【举例】
三竖线之前的数字表示的是句子号，XXXXX 表示文中缺少的某一个词（仅做举例，并非实际的测试样例）。

2）用户提问型问题

篇章：由若干个连续的句子组成的一个文本段落
问题：由人工提问的问题
答案：问题对应的答案

【举例】
注意：与填空型不同的地方是，用户提问型问题的篇章是完整的

奖项设置

本次评测对于上述两个 Track 分别进行比赛，分别排名，并根据每个 Track 的最终评测结果分别取前三名进行奖励。

奖项包括：

1）由CCL2017主办方中国中文信息学会（CIPS）为参评队伍提供成绩证书认证。

2）奖金奖励：
金奖：￥10,000 + 荣誉证书
银奖：￥5,000 + 荣誉证书
铜奖：￥3,000 + 荣誉证书

感谢科大讯飞及全国计算语言学学术会议（CCL）为本次评测的前三名提供奖金奖励。

更详细的评测信息会陆续更新，请密切关注。

重要时间点

以下所有时间点为北京时间（GMT+8）11:59 PM。
（除报名时间以外，其他时间点可能会有变动，请注册参加者密切关注本网站以及邮件通知。）

事件	时间
预报名	2017年4月5日 ~ 2017年4月17日
正式报名	2017年4月18日 ~ 2017年4月25日
发布训练集和开发集	2017年5月3日
系统搭建及调整	2017年5月3日 ~ 2017年7月31日
提交系统验证开发集	2017年7月1日 ~ 2017年7月31日
提交系统验证测试集	2017年8月1日 ~ 2017年8月3日
撰写系统描述	2017年8月18日
召开 CMRC2017 大会	2017年10月13日