专栏名称: CDA数据分析师
CDA数据分析师品牌官方微信,开放、创新、分享。
目录
相关文章推荐
数据派THU  ·  原创 | 展望大语言模型在AGI时代的发展前景 ·  4 天前  
数据派THU  ·  【NeurIPS2024】将连续潜在变量模型 ... ·  6 天前  
商学院  ·  有奖问卷 | 激活未来组织 ·  4 天前  
大数据文摘  ·  Ilya承认Scaling ... ·  1 周前  
51好读  ›  专栏  ›  CDA数据分析师

对话猎聘CDO单艺:数据人才稀缺困局,招聘网站内部也在寻找最优解

CDA数据分析师  · 公众号  · 大数据  · 2017-05-31 18:16

正文


作者  魏子敏
*本文为清华数据科学研究院联合大数据文摘发起的《数据团队建设全景报告》系列专访内容。

转自大数据文摘(bigdatediegst),转载需授权

 

单艺  猎聘首席数据官


当被问及团队发展最大的挑战时,猎聘的首席数据官单艺脱口而出:“首先是人才,高素质的数据人才太稀缺了。我们是招聘方面最难满足的部门。”


这似乎是个颇尴尬的场面:猎聘,这家致力于中高端人才招聘多年的互联网人力资源服务公司一直引以为傲的数据团队,竟然也面临着人才招聘的“老大难”问题。


而这个招人难的局面不止在猎聘存在,清华数据科学研究院执行副院长韩亦舜称,目前国内数据人才缺口是百万级的。不止中国,全球的数据人才都处于极其稀缺状态,全球最大的人才社区领英LinkedIn也向大数据文摘透露过同样的招人难题。它们正无比真实的折射出一个数据团队建设的巨大难点:数据人才的奇缺。


宁缺毋滥,数据团队是HR招聘团队最难满足的部门

猎聘的数据团队在单艺加入后的2014年10月正式成立。“当时我加入猎聘担任CDO(首席数据官),开始建立大数据团队。我们团队的名称叫大数据研究院,希望做深入的研究和创新的应用,挖掘人才大数据的价值。大数据研究院是一个战略级的部门,我直接向CEO汇报。”

 

目前,猎聘的大数据研究院是一个比较精干的三十人团队,承担着大数据平台研发、机器学习/人工智能研究与应用、数据收集与整合、数据产品开发和支持业务部门数据驱动,五大块业务。单艺认为一个团队的价值,不在于规模,而要看这个团队在公司和所属的行业的定位和贡献。团队要围绕核心价值,去配置相应的资源和人才。团队的组织架构设计也要围绕着业务展开。猎聘大数据研究院在内部按照业务线形成了多个精干而专注的敏捷小组,直接和公司各业务线协同工作。

  

猎聘数据团队

 

“其实我是希望团队在满足业务增长需要的前提下,能保持一个小而精的一个状态,一个扁平的架构,不能人浮于事。”单艺说,“我们招聘的一个基本原则就是:宁缺毋滥。我们做的工作对于公司的价值是非常大的,如果做得不好,对公司的杀伤力也是很大的。如果一项重要的商业数据分析的结果错了,那会影响到公司做出错误的决策。同时,我们所做的机器学习研究和大数据工程都充满了技术挑战。所以,我们招人要严格,要求在硬技能和软技能方面都达到优秀的标准。”

 

这种高标准的招人要求也给公司的人力资源部门提出了挑战,“确实,由于专业性强,没有经验的HR很难准确把握大数据人才的特征。”单艺笑称他们是HR招聘团队最难取悦的部门,而他也从中看到了人才大数据的价值所在。“其实,我们可以用大数据和机器学习帮助HR更好地完成招聘工作。”

 


把求职招聘大数据玩儿起来,实现人岗匹配的人工智能化

在HR的工作内容中,找简历是重复性最高的一类活儿。找简历看似简单,但是有的时候也是挺有难度的。为了找到合适的人选,HR招聘团队需要理解业务团队的五花八门的需求。专业化程度高的技术岗位会要求有多种专业技能。比如数据挖掘工程师,就常常要求候选人能够有良好的数学和最优化理论基础,熟练掌握常用的近十种机器学习模型和算法,还要能够写一手好代码并能够处理大数据。要理解这些需求,对于一般HR来讲近似于读天书。


用什么样的关键词去找简历?如何判断候选人的经验和水平?如何了解候选人的求职意愿?对于HR,解决这些问题需要大量的学习、摸索和积累,而且很难传承。而大数据和机器学习/人工智能技术提供了解决这些难题的新思路。


猎聘大数据研究院研发的机器伯乐系统,通过使用深度的信息抽取技术、语义分析和相似度模型,已经能够比较准确地分析企业的职位需求和简历内容。同时,通过对HR和候选人的行为进行分析、建模,系统可以自动学习复杂的人岗匹配的模式。通过对数十万HR和数千万的候选人的相互选择行为进行24x7的不间断学习和积累,系统已经能够对五十多个行业和近千种职能进行较为准确的匹配,为候选人和HR提供了良好的“千人千面”的个性化服务。



“人才大数据有非常大的潜在价值。除了智能人岗匹配之外,我们还在不断地想新的点子,挖掘数据的用户价值,形成产品。”在这方面,猎聘一个比较典型的例子是基于大数据的薪酬数据库。

 

“很多企业,尤其是互联网企业,可能半年就要去看看自己公司的薪酬结构是否合理,这需要市场的数据作为参考。传统的薪酬数据往往是线下调研得来的,这个过程比较漫长,往往需要一年之久。而我们通过挖掘互联网大数据,快速跟踪市场的变化,将更新频率缩减到季度。同时我们通过机器学习技术将行业和职能进一步细分,能够更加精细地反映不同人才的市场价值。这就能帮助HR做更好的薪酬工作。”

 

单艺称大数据对于招聘行业有广泛的价值。“猎聘的人才大数据能够比较全面地反映中高端人才的人才情况。我们可以从数据上看出人才市场的发展趋势和变化。数据可以起到风向标的作用。”猎聘本身也在积极主动的把这些数据分享出去,比如会发布一些相关报告(可查看相关文章《猎聘:分析70万在线职位后,告诉你数据分析师前景》http://dwz.cn/60ZCw1);还曾经为国家发改委做专项的课题研究,分析各个地区的经济发展和人才资源是一种怎样的关系。

 

“有一些报告能反映出中国的一些专业人才的职业发展的整体趋势。比如人到中年,35岁,大家逐步地都会产生一些危机感,年轻的时候人很容易往上走,但是到了这个年纪,可能就遇到了平台期,会思考下一步该怎么走,是跳槽多发期。另外也跟外企现在的发展趋势有关。包括一些大的企业对于35岁以上员工的政策,这也导致了这部分人的跳槽和流失。”单艺举例说。

 

猎聘的行业数据团队经常与市场品牌部的传播团队进行合作,一起探索数据的新闻价值。“市场部门对媒体、热点会有很敏锐的感觉和意识;而数据分析师擅长从指标中发现波动、走势,从数据中看到一些当时还没被发现的情况。”单艺称通过和传播团队进行定期的例会和头脑风暴,在一起讨论可以做什么样的选题,希望能够做出契合社会热点、有深度和态度的内容。

 


闷骚还是外向?搞数据驱动的分析师要有“两面性”

而如何让自己的团队与业务部门结合的更加紧密?单艺称,目前会鼓励自己的团队成员与业务部门尽可能多的泡在一起,争取嵌入式的工作,主动研究业务,寻求数据驱动的机会。

 

“很多情况下,业务部门能够意识到数据的重要性,他们会主动去邀请我们参与业务优化的项目。但是有的时候,一些业务团队会因为传统的思维或者已有的利益关系,并不能主动地用好数据分析。这时候就需要我们自上而下的去推动他们。这时候往往需要说服业务线的老大。如果还不够,那就会去找CEO来推动。很多数据驱动的事情是一种变革,就是需要自上而下的推动。”

 

单艺认为数据分析师是一个特别有意思的角色,一方面他要有科学家的思维,能够理性、深入地思考问题;另一方面要和业务打成一片,擅长沟通,能够去影响别人。理想的数据分析师是很稀缺的,因为有科研气质的人往往会比较闷骚、内向;做业务协作时他又必须属于输出型的,所以数据分析师做起来很“两面化”:“我们团队的很多人都做过性格测试,大部分人还是偏内向,但都是偏内向一点,不会偏得很厉害。太内向的人基本上在这里很难‘存活’下去。所以对于数据分析师,有咨询经验的,往往会比较受青睐。因为数据分析师的工作跟咨询师很像:对于业务线,数据分析师希望能够扮演‘军师’的角色。”

 

数据分析是一种科学与艺术结合的工作,而且单独一个部门往往无法完成全部的工作。“业务线的人往往不懂数据科学;而业务上的知识,我们也要去学习研究。磨合的深浅,一方面取决于业务部门对数据的理解和接受程度,另一方面取决于我们分析师的影响力,沟通力,怎样把复杂的事情说得简单、明了。这对分析师就是不仅仅是技术上的要求了。所以我觉得分析师的影响输出能力是很关键的,而且是主动的输出,被动输出就晚了来不及了。通过做一些事情,能让他们的业绩指标成倍地往上翻,他们就信数据分析了,合作也会越来越好。” 



数据科学家和数据分析师中间只隔着一个程序员

“数据科学家和数据分析师中间隔着一个程序员。”这句调侃的话也说出了数据科学家是个要求比较综合的岗位:不仅要会统计分析,也要会编程去处理数据、开发生产级的系统。“数据科学家的定义是比较模糊的。很多时候一个能够做业务数据分析,懂机器学习,又懂工程开发的分析师就是一个数据科学家。在工业界,只有技术和业务两手都硬,数据专家才能够创造最大的价值。现在数据分析师中存在的一个普遍问题是编程能力比较弱,导致在实际工作中处理复杂数据时会有困难。分析师需要加强编程的训练。”

 

单艺已经在硅谷和北京从事数据工作17年。他对于在校学生或者刚毕业的学生也提出了一些建议:

 

首先得了解自己,想做分析师,还是工程师,哪个方向才是真正喜欢的。至少三年内自己是一直有热情去投入到这方面的工作的,这是根本;

 

第二点就是根据自己所选择的方向,需要思考如何提高能力和竞争力。比如分析师需要有很好的统计能力,懂数据挖掘、机器学习的方法,就需要打好基础、熟悉工具。同时还要懂商业运营,那就要修商业方面的课程。还需要影响别人,那就要去多参加演讲类的活动,多跟别人沟通,多参加一些比赛等等,这样才能把自己的能力准备起来,参加工作的时候就会走得更快一些。

 

总结起来就是,第一要想清楚我想干什么,第二就是我能干什么,然后就是结合市场,看看市场上更需要哪方面的人才。


推荐阅读


我分析了 6.5W 字的歌词,看到了这样的周杰伦!

柯洁又输了,关于人工智能AlphaGo你需要知道些什么

男性人口过剩:亚洲性别比例失衡远比你想象中严重

【书单】18本数据科学家必读的R语言和Python相关书籍

如何像数据科学家一样思考

北京VS上海,哪座城市人口更多?

我是如何一不小心阻止了勒索病毒的全球蔓延

用python抓取摩拜单车API数据并做可视化分析(源码)

2017年大数据和数据科学的六大发展趋势

你每天要花多少时间在手机上?

初级数据科学家求职时的 3 大必备能力

不可错过的优质深度学习课程

职场 | 数据库面试常问的一些基本概念

听说你最擅长“拖”,你“拖”得过Excel吗?

数据科学优质课程推荐#2:统计入门课程篇

歌手外科和猴姑,大数据告诉你白百何出轨后谁最惨

想学习数据科学?我们整理了一份优质编程入门课程清单

数据科学家在美国仍然是最热门工作的3大原因

一个优秀数据分析师的准则