成立第 6 年,我们成长为世界上最大的中文知识社交平台。在知乎,每天都有数以十万计的新内容产生,数以千万计的知友在这分享、获取知识。
如何让每位知友发现自己最需要、最喜欢的内容?这需要通过机器学习技术,对知乎的海量内容做更好的理解和分发。
最近,我们联合中国人工智能学会、 IEEE 计算机协会和 IEEE 中国代表处,举办「2017 知乎 · 看山杯机器学习挑战赛」,邀请更多人一起参与解决这一挑战。
赛题围绕如何给知乎上的问题打话题标签来设计。报名从 5 月 15 日正式启动,在 8 月 15 日比赛结束前,你可以随时参赛。
我们首次开放了自然语言文本数据供你随意研究(当然,为了保护用户隐私,我们做了脱敏处理),同时,还为你准备了 ¥80,000 的总奖金以及好玩的周冠军礼品。
这将是一次你亲自参与改进知乎的内容理解技术,并提升数以亿计的知友体验的经历,听起来是不是有点酷?未来,知友的所见所闻,可能是因为你的算法在幕后默默支持。
下面是比赛的详细介绍。现在已经有选手在提交成绩,如果你对语义分析感兴趣,欢迎来和他们一起比拼~
参赛者需要根据知乎给出的问题及话题标签的绑定关系的训练数据,训练出对未标注数据自动标注的模型。
标注数据中包含 300 万个问题,每个问题有 1 个或多个标签,共计 2000 个标签。每个标签对应知乎上的一个「话题」,话题之间存在父子关系,并通过父子关系组织成一张有向无环图(DAG)。
5 月 15 日 :比赛开放提交答案入口
5 月 15 日- 8 月 15 日:比赛期(比赛期间可随时报名)
8 月 15 日:比赛截止,计算排名。
8 月 16 - 17 日:公布比赛排名
9 月 2 日:颁奖活动
一等奖 1 名,奖金:¥40,000
二等奖 2 名,奖金:¥10,000
三等奖 4 名,奖金:¥5,000
比赛期间所有的周冠军队伍都将获得「刘看山」小礼品,以及由大赛组委会颁发的获奖证书 & 技术图书哦n(*≧▽≦*)n
点击下方报名按钮或阅读原文可直达赛事页面,注册网站 -下载数据,即可参赛。
大赛官方网站:https://biendata.com/competition/zhihu/,因涉及到数据下载,强烈建议大家在 PC 页面上登录报名参加~
本文内容综合整理自知乎微信公众账号(ID:zhihu),点击阅读原文查看官方账号的推文。