专栏名称: 炼数成金前沿推荐
关注炼数成金,学习数据挖掘与分析技巧,了解最新快的数据分析课程信息。更多知识更多优惠,尽在炼数成金!招募天下好汉,一起炼数成金!
目录
相关文章推荐
宁夏高级人民法院  ·  法护未来丨中卫中院以法为盾护航“未”来 ·  昨天  
天津高法  ·  津小法有话说 | ... ·  2 天前  
天津高法  ·  津小法有话说 | ... ·  2 天前  
最高人民检察院  ·  小案里的烟火气 ·  4 天前  
51好读  ›  专栏  ›  炼数成金前沿推荐

在分析AI顶会上的6163篇论文后,我们能发现怎样的发展趋势与变化

炼数成金前沿推荐  · 公众号  ·  · 2017-10-09 17:03

正文

最近,有关人工智能(AI)的研究在各个领域都取得了显著的成果。这主要归功于长期以来一直致力于这个研究领域的AI研究人员的努力。如果根据引用次数、参与人数、接受论文数量和历史记录来看的话,关于AI的最重要的学术会议就是ICML(International Conference on Machine Learning)和NIPS(Neural Information Processing Systems)。相较于ICML的重点是机器学习,NIPS涵盖的课题领域就较为广泛了,包括认知科学和应用机器学习。在37年前的1980年,ICML举行了第一次学术会议,并于今年8月在澳大利亚悉尼举行了第34次会议。NIPS成立于1987年,并计划于2017年12月在加利福尼亚举行第30届会议。


为了研究AI研究领域的趋势,研究小组对2005年至2016年期间ICML和NIPS发表的6163篇科学论文进行了荟萃分析。的研究结果揭示了AI研究的趋势和变化。通过对过去12年来被引用次数最多的论文进行研究,从各种角度,如累积引用,作者的合作网络,以及论文中关键字的变化。分析了最近的趋势和变化,从诸如累积引用,作者的合作网络,以及论文中关键字的变化等角度入手,以分析AI研究领域的发展趋势和变化。


[1.过去12年接受的论文数量的变化]


ICML在过去12年接受的论文数量的变化


从2005年到2016年,ICML总共接受了2315份论文。2016年接受的论文数量为322篇,比11年前的134篇论文翻了一倍还多。


NIPS在过去12年接受的论文数量的变化


而至于NIPS,接受的论文数量从2005年的207份增加到2016年的568份,增加了一倍多。


研究团队可以证实,对于ICML和NIPS来说,2012年接受的论文数量与2011年相比都有显著上升。这是2012年人工智能研究历史上的一个重要事件。2012年,Geoffrey E.Hinton教授和他的团队(多伦多大学)在Imagenet大型视觉识别大赛(ILSVRC)中使用深度神经网络展示了一个很好的成果。


[2.作者引用次数]

在过去的12年里,ICML中被引用次数较高的前20名作者

在过去的12年里,NIPS中被引用次数较高的前20名作者



在过去的12年里,ICML和NIPS中累计被引用次数较高的前20名作者


以下图表显示了(分别为NIPS和ICML)中接受论文和被引用总数较高的前30名作者。 (https://github.com/giallo41/Data_Science/blob/master/Conf/data/ALL_most_cited_author_Graph.xlsx)




以下图表表示的是年度引用次数最多的15名作者:


在被引用最多的15名作者中,每年被引用次数的变化


在被引用最多的15名作者中,年度论文的变化


该研究小组调查了在ICM和NIPS中排名前15位的作者的12年变化趋势。之所以选择15个作者的原因是,这个数字可以通过数据可视化显示出最有效的趋势。上面的图表显示了这15位作者的累计引用次数和被接受的论文数量。他们表示,那些在接受论文数量上逐渐变化的作者,每年也会不断地发表论文。在GitHub上可以找到完整的ICML和累计引用的列表。


下表列出了以上图表中15位作者所发表的论文中引用最多的论文。(下载原始文件)(https://github.com/giallo41/Data_Science/blob/master/Conf/data/Top15_most_cited_papers.xlsx)

大多数引用的文章由这15位作者撰写


[3.合作网络]

具有较高引用率的作者合作网络


上图显示了ICML和NIPS接受的论文中被引用最多的作者的协作网络。粗体线意味着他们经常作为合作者出版。为了更好地进行分析,研究团队创建了由15位被引用次数最多的作者发表论文的共同作者的关系网络图。分析中使用的数据可以在GitHub中找到。 (下载原始图片)(https://github.com/giallo41/Data_Science/blob/master/Conf/author_network.png)


[4. 最常用于标题的关键字]


为了间接地展示出过去12年里人工智能领域的研究课题的变化,研究团队分析了论文标题中的关键字的变化。首先,团队在过去的12年中,用了词“云”来了解趋势变化的大致情况。过去12年在ICML和NIPS中使用频率较高的两个关键字是“学习”和“模型”。由于这两个词是目标研究期间在论文标题中出现的频率较高,所以团队认为,除了这两个词之外的其他关键字将显示AI研究的趋势变化。选定的基础年份是2006年,2011年和2016年。选择5年的时间间隔能够更为清楚地研究变化。


出现在ICML接受的论文标题中的关键词(更大的词意味着它们更常用于标题中。)

ICML 2006

ICML 2011

ICML 2016

对于ICML收录的论文,2006年论文题目中最常使用的关键词是“贝叶斯”、“核”和“分类”。 但是,2016年收录的论文则频繁出现“网络”、“算法”、“优化”,“深度”等关键词。

NIPS收录的论文标题中出现的关键字(越大的词意味着它们更常在标题中出现)。

NIPS 2006

NIPS 2011


NIPS 2016

对于NIPS收录的论文,2006年论文题目中最常使用的关键词是“贝叶斯”、“核”、“分类”和“聚类”,与ICML收录的论文中出现的相似。相比之下,“深度”、“自然”、“网络”和“随机”等词在2016年被NIPS收录的论文中出现更为频繁。对这些关键词的考察,我们了解了过去10年研究主题的变化。

为了了解过去10年人工智能研究课题的变化,对频繁出现的标题关键词进行了分析。


ICML录用论文中的标题关键词比较:2006年和2016年

NIPS录用论文中的标题关键词比较:2006年和2016年

虽然关键字“深度”在ICML中没有出现,但在2006年的NIPS中只出现一次,但在2016年随着“网络”一词成为最显著的关键字,在ICML中出现了22次,在NIPS中出现了43次。

年度文章标题的主要关键词的出现次数比较:













年度ICML论文中主要关键词出现次数的变化















年度NIPS论文中主要关键词的出现次数的变化

[5.AI领域研究员网络]

AI研究网络的主要broker是Michael I. Jordan。


研究团队还根据NIPS和ICML的录用论文,对研究人员网络进行了研究。特别注意网络中研究人员的身份。所选择的基本指标是度中心性(degree centrality),其通过对每个实体对网络中的其他实体的直接链接的数量进行计数来衡量实体的连接度,以及中介中心性(Betweenness Centrality),指的是作为连接网络中的其他实体的broker的能力。为了将这两个概念应用于研究网络,度中心性意味着研究人员之间的直接联系的程度,而中介中心性意味着研究人员之间broker的能力。对于构成网络结构的研究人员数量,NIPS为5878人,ICML为3949人。基于网络分析的结果,以度中心性和中介中心性排名前20位的研究人员如下所示。图中的索引是使用顶部数字的值作为分母的标准化值,这使得相对比较更容易。







请到「今天看啥」查看全文