作者:文若、勃勃
来源:51cto
链接:http://news.51cto.com/art/201707/545617.htm
现在流行这么一句话:“找工作的时候,只有两种专业——计算机系的和非计算机系的。”这些年,选择了计算机系的人都在虐人模式的人生游戏里开挂,而非计算机系的人则在被虐模式里挣扎。
可是你注意到了吗?即使是同为计算机专业的人,薪酬待遇也有高低差别。
计算机方向不同行业的薪酬价值,各大招聘网站每天写来写去,想必大家都看烦了。今天想和大家聊聊不同的东西——抛开物质回报不谈,身为码农的你,在工作中积累的各种技能,究竟值多少钱?
从招聘需求中挖掘技能价值
从招聘网站上爬取了 100 多万条有关计算机专业的职位招聘文本,每条文本主包含职位工资和职位要求。我们要做的是从文本中识别“技能”,然后将其和职位工资关联起来。
为了从职位要求描述中抽取技能,我们采用 weak-supervised learning 的方法。
我们首先对职位招聘文本进行句法分析,生成一个粗略的职位技能集合,这个集合是满足语义树正则表达式的所有名词或动名词短语。
然后进行少量的人工标注建立训练集,采用 BiLSTM 的实体识别模型对招聘要求描述中的技能进行识别和抽取。
最后不断迭代“标注-训练-预测”这个过程,优化识别结果。
算法框架如图所示:
图一
最后,将抽取的技能实体和职位工资关联,并人工分为了几组。下面让我们看看每一组技能价值的结果吧。
PHP 是最好的语言?
好吧,这其实是一个广为流传的笑话。说是有三个程序员坐在格子间里编程。第一个程序员一言不发。第二个程序员写一会儿就按一下编译,然后就玩会儿手机。
第三个程序员坐在那里浏览网页,不时飞快的键入一些字符,看起来不怎么干活,尽在上网。请问,他们分别是用的什么语言?
图二
言归正传,学会各种编程语言究竟能给你增加多少身价?
我们的文本挖掘结果显示,排名第一的编程语言是 Scala,价值 17.68k,而最后一名是 C 语言,仅有 9.46k,是Scala的一半多一点。
Scala 作为大数据处理、建模的函数式语言,之所以这么值钱,主要源于前些年大数据产业的爆发。但随着近几年大数据产业重归理性,以及 Scala 人才数量的增加,其价值也会逐渐回归到正常价值。
还有一个在数据挖掘领域讨论比较激烈的话题是,我该学 Python 还是学 R?
文本挖掘结果显示,Python 的价值比 R 高出 30%。这可能是由于,在近年来越来越火的人工智能领域里,很多算法框架都优先支持 Python,从而导致 Python 的价值逐年升高。所以,如果是初入数据分析行业,还是学 Python 吧。
其他的处座就不一一分析了,反正除了 PHP,你们都是最好的语言……
码农生存工具鄙视链
聊完了编程语言,我们再聊聊码农们赖以生存的开发工具。
如今,做移动应用的码农要使用 Recat Native、Weex、Cordova 或者 Ionic 等框架;做深度学习的算法工程师要使用 keras、theano 或者 tensorflow 等框架;做项目管理的架构师要使用 word、excel 和 ppt 等。
那么,不同的开发工具,在价值上有多大的差别呢?
图三
分析结果显示,排名前三的工具分别是 keras、theano 和 tensorflow,其价值分别达到了 45k、29.29k 和 26.71k,在码农生存工具鄙视链上远远超过其他工具。
随着人工智能概念的火爆和深度学习人才的稀缺,掌握这三款用来进行深度学习建模的框架,对码农个人价值的提升是极大的。
当然,从另一个角度来看,这不合理的差距,也说明了深度学习产业存在泡沫。作为深度学习的算法工程师,也当居安思危,多掌握一些其他的工具框架,以应对泡沫破灭的到来。
另一个有趣的点是处于码农生存工具鄙视链最底端的办公三兄弟 word、excel 和 ppt。
十年前有一句老话说:写 word 的不如写 excel 的,写 excel 的不如写 ppt 的,写 ppt 的不如讲 ppt 的,讲 ppt 的不如听 ppt 的……
从鄙视链上来看,确实如此,ppt 技能价值 8.36k,excel 技能价值 8.05k,而 word 技能仅价值 7.30k。
在这一节的最后,处座想说,其实生存工具鄙视链并不应该存在,做深度学习的并不优于做移动开发的。这不过是因为技术的发展和经济结构的转型而造成的误会而已。
有人曾感叹:“现在在公司的格子间里面哼哧哼哧做 ppt 的那些人,和当年踩着缝纫机的女工们,其实没有本质的区别。”
是的,没有本质的区别,而我们的表现并没有优于我们的父母,这一切都不过是经济结构转型造成的生存工具的变化而已。
哦,不,还是有区别的。起码纺织工做完一个成品以后,可不会被关到一个小房间里,投到一个大屏幕上,然后让一群人围着羞辱你……
学子们该如何选专业?
计算机专业出身的学生有很多方向可以选择(你在问为什么只说计算机?请重读本文第一句话)——计算机硬件、大数据、人工智能、互联网开发等。下面处座列出了这四个方向技能树价值,供学子们选专业时参考。
计算机硬件技能价值表
图四
大数据技能价值表
图五
互联网开发技能价值表
图六
人工智能技能价值表
图七
最后,希望这篇文章对于处在人生节点的你能有所帮助,愿你能活在自己的节奏里,修炼内功,点好自己的技能树,让自身越来越有价值。
文若
Gammar Lab成员
自然语言处理爱好者一枚,致力于将人工智能技术应用于金融领域。
勃勃
Gammar Lab成员
麻省理工博士,爱好讲故事的算法工程师,擅长金融+人工智能产品研发。
在微信公众号内回复数字“1”
小编拉你进粉丝微信群
不是在文章评论里回