专栏名称: PaperWeekly
PaperWeekly是一个分享知识和交流学问的学术组织,关注的领域是自然语言处理的各个方向。我们热爱知识,分享知识,希望通过我们大家的努力为自然语言处理的发展做出一点点贡献。我们每周会分享一期特定话题的论文笔记和本周值得读的相关论文。
目录
相关文章推荐
科研大匠  ·  上海交大联合武大、浙大发Science:首次 ... ·  3 天前  
弗雷赛斯  ·  国自然放这张预实验图,中标概率大增! ·  昨天  
募格学术  ·  发Paper利器!人文社科研究者专属Pyth ... ·  3 天前  
51好读  ›  专栏  ›  PaperWeekly

预测科学研究热点趋势:微软 · 清华学术画像赛开始了!

PaperWeekly  · 公众号  · 科研  · 2017-07-31 07:48

正文


扫描二维码,或点击「原文链接」浏览比赛详情

· 组织

联合组织: 清华大学、微软、中国人工智能学会、IEEE、Computer Society、中国工程院知识中心、清数大数据产业联盟(微信公众号“TH数据派”:ID:datapi)、华章图书、Paperweekly(微信公众号:Paperweekly)

全世界有多少科研工作者?

1亿人。

这些学者一共发表了多少篇论文?

3亿篇。

这些论文中,被语义标注的有多少?

只有3%。

论文数据囊括了大量的知识,隐含了科技的进步和人类发展的趋势,如果可以更好地利用这些数据,可以更深入地了解人类知识的进展和边界。


最近,微软和清华大学,联合 IEEE 计算机协会、中国工程院知识中心、中国科学院文献情报中心、中国人工智能学会,以及 IEEE 中国代表处等机构。举办「2017 开放学术精准画像大赛」,寻找数据分析高手。比赛从 9 月 18 日正式启动,在 9 月 14 日比赛结束前,你可以随时参赛。


这是研究机构首次开放如此规模的学术标注数据。同时,主办方还准备了约 ¥20 万的总奖金以及来自微软的神秘周冠军礼品。


倘若奖金什么的不足以打动你,那么有机会接触到那么多标注好的学术数据,来分析汇聚人类智慧最前沿的数据吧!听起来是不是有点酷?


下面是比赛的详细介绍。感兴趣的同学,赶紧点击原文链接进入大赛官网报名吧!

· 赛题描述

参赛选手根据学术数据挖掘系统 AMiner.org 和 Microsoft Academic Graph 提供的数据集,提取学者的个人描述信息,分析学者的研究兴趣,以及预测学者的论文引用情况,从而更好地面向学术界提供专家信息、评估学者研究成果、介绍科学研究进展、展示学术发展动态。任务具体描述如下:

任务 1: 学者画像信息抽取


学者画像信息具体包括学者的主页地址、性别、职位等。随着互联网越来越普及,与学者相关的网页的数量和内容的丰富度和复杂度都大大增加,其中包含了学者的大量冗余信息,通过整合互联网上多种来源的学者数据,采用合适的机器学习模型,获得学者的精准信息是一项潜在有效的学者画像技术。


任务 2: 学者兴趣标签预测







请到「今天看啥」查看全文