专栏名称: 环球科学
《科学美国人》独家授权中文版—《环球科学》杂志—www.huanqiukexue.com
目录
51好读  ›  专栏  ›  环球科学

搜狐图文匹配算法大赛复赛资格赛倒计时2天!(附搜狐大数据中心算法团队负责人访谈)

环球科学  · 公众号  · 科学  · 2017-05-06 15:24

正文


搜狐图文匹配算法大赛复赛倒计时还有2天!还在等什么,快去www.luckydata.org(或点击原文链接)赶上复赛末班车!

 

2017年5月7日中午12:00整,竞赛官网将公布复赛资格赛的测试集,所有参赛选手需要在2017年5月8日中午12:00前提交结果,排位前20名的团队可以获得【搜狐2017图文匹配算法大赛】复赛资格。参赛选手将利用搜狐新闻客户端提供的数据,匹配内容对应的新闻文字和图片。本次比赛分为初赛、复赛和决赛三个阶段,总奖金1.7万美元,前10名的队伍将获得搜狐的实习/工作offer 

 


近日,大赛组委会专访了搜狐大数据中心算法团队的负责人陈义博士,他也介绍了设计比赛的目的,并对比赛选手提出了一些建议。

 

搜狐图文匹配算法大赛的初赛阶段已过半,本周的周冠军得到了0.22870分的成绩。参赛选手们惊叹说“能做到0.1就已经是非常厉害了”。您怎么看?您预期大赛最好成绩能达到多少?

 

陈义:0.22870已经是一个让人赞叹的结果了。至于大赛最终最好成绩会是多少,做为一个靠谱的预测者,我基本不事先对结果进行预测。

 

最近两周参赛选手日常排行榜TOP3的分数均在0.22分左右,貌似大家都进入了瓶颈期。您有哪些提示或者建议给到参赛选手们吗?

 

陈义:新闻配图形式是非常有多样性的,室内外场景照片、漫画、工笔画、打印字体、变形字体等各种形式的内容都有,很多选手都很机智地选择其中一两种配图形式为突破口,快速取得较好的成绩。红利用尽后,相信后一阶段选手们应该会扩大突破口的。

 

我们大赛的初衷是从业务需求角度出发的,那么您觉得0.22这样的分数跟搜狐的实际业务需要还相差多少?

 

陈义:虽然竞赛题目是从我们实际业务需求中抽象出来的,但我们在设计竞赛题目的时候,有意选择了比较有开放性的问题。我们还是比较希望比赛中能出现一些我们期望之外的结果的。就像前面说的,目前比较突出的结果主要集中在其中一两种配图形式上,对这些类型的配图,目前的结果其实已经有很强的实用价值了,不过我们还是期望比赛后半段选手们能有精力和时间全方位突破。比赛结果能否直接在业务中使用,并不是我们唯一关心的问题,做为资讯传播领域的探索者和领先者,搜狐有责任去推进图像和文本理解技术的发展,也会受益于这些领域的发展的。

 

 

【分享会通知】

 

本周日(5月7日)晚八点,比赛组委会将邀请一名Tensorflow专家以本次比赛作为案例,分享如何使用Tensorflow进行图片识别工作。分享将在搜狐算法大赛官方微信群进行。如果你希望加入算法大赛官方微信群,请选择以下三种方法中的一种:

 

一、 关注PaperWeekly官方微信号,回复“数据竞赛”获得入群信息。

PaperWeekly是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。

 

二、 关注科研圈官方微信号,回复“数据竞赛”获得入群信息 

科研圈是由《科学美国人》中文版《环球科学》运营的学术传播平台,面向数十万一线科研人员。


三、 关注IEEE计算机协会微信号,回复“数据竞赛”获得入群信息

IEEE计算机协会是IEEE旗下最大的协会之一,致力于推广计算机领域的先进理论和技术。