作者:郑开州 R语言中文社区专栏作者
知性而淫荡,神秘又开放小伙子。 。
讨论岗位:数据分析
数据来源:网络爬取
分析工具:R 语言
样本容量:
## [1] 1455
数据格式:
## | 岗位 | 薪资 公司地址 工作年限 学历 | 技能要求 |
## 1 钱包-数据分析师 25K-35K | 北京 | 3-5 年 本科 | 数据分析 |
## 2 | 数据分析师 10K-20K | 上海 | 1-3 年 本科 | Hive |
## 3 | 数据分析专员 6K-10K | 上海 | 1-3 年 大专 | HQL |
## 4 | 数据分析师 7K-13K | 青岛 经验不限 硕士 | 数据分析 |
## 5 | 数据分析师 8K-10K | 武汉 | 1-3 年 本科 熟练使用 VBA |
## 6 | 高级数据分析师 20K-40K | 北京 | 3-5 年 本科 | 精通 Excel |
特别说明 1:数据全部来源自网络,仅供参考
特别说明 2:瓜田不纳履,没有采集招聘单位的名称
特别说明 3:采集下来的薪资是一个区间,无特殊说明均值全部是区间平均数
根据各个城市发布的数据分析岗位招聘的频次,我们得到数据分析岗位在全国前
13 个热点城市:
毫无悬念,北上广深占据了前 4 位。成都、南京、大连、江苏紧追其后。
意外地,江苏盐城排在了杭州、天津的前面。
最出乎意料的是:武汉居然没有上榜!
根据每个岗位的薪资平均值(区间平均数),计算出热点城市给数据分析岗位的平均薪资:
令人惊讶的是大连给出的薪资是最高的,超出北上广深一截。后面我们再来查找大连的薪资这么高的原因。
北上广深中上海给出的薪资 18K 是最高的,北京 16K 紧追其后,广州 13K 排第三位,深圳 8K 排名最后。
江苏盐城不仅仅对数据分析的热情令人惊讶,给出的薪资 10K 也让我感觉奇怪。甚至超过了深圳 8K 和天津 7K。
招聘信息上面给出的薪资是一个范围,分别取各个城市的最高值平均和最低值平均计算招聘单位给出的薪资浮动空间:
红色是招聘信息的薪资区间下限平均,算作现实值。因为公司一般都是按照招聘信息的下限给钱;绿色是招聘信息的薪资区间上限平均,算作理论值。
理想很丰满,现实很骨感。
按照学历分组,我们计算了这个行业对于学历的需求度,以及各个学历层面的人员能够拿到的平均薪资。结果如下:
可以看到招聘的最多的是本科生,其次是大专,硕士招聘次数不多。
但是待遇方面,硕士的平均工资 16K 高于本科 14K,多出 14%;本科的平均工资 14K 远远大于大专平均工资 9K,多出 55%;得到的结论是:
1、学历越高,数据分析岗位的工资越高
2、数据分析岗对本科学历人才的需求程度最大
和学历类似的统计方法,我们得到了数据分析岗位对工作经验的需求度和平均薪资:
关于工作年限,1-3 年和 3-5 年工作年限的人被接受的程度最高。应届生被接受的程度最低,囧。而在薪资待遇方面,工作时间越长,对应的薪资待遇也就越高。特别需要关注地,1-3 年工作经验一下的平均薪资只有 9K,3 年以上的平均薪资就达到了 17K,3 年经验是个坎儿。
得到的结论是:
1、市场对 1-5 年工作经验人才的偏好大于其他层面人才
2、越老越吃香
3、三年是个分水岭
面对层出不穷的工具,我们来看一下数据分析市场对各种工具和技能的需求和回报(因为横坐标文本过多,选择用横向分面):
在这里发现了一个好玩的现象:数据分析岗位招聘信息中,工作技能需求最多的是数据分析和数据挖掘,而没有明确给出某一个具体的工具和技能。好多公司连自己需要招聘个什么样的都不清楚,只是知道要招一个数据分析人员;薪资待遇给的最高的是数据库相关-20K,其次是 Linux-19K,然后是会计-15k!我 R 语言-12K 名列第七;python 没有上榜,对此表示很遗憾!我们都输给了会计。
得到的结论是:
1、部分公司发布招聘信息没有明确的目标
2、数据库和 Linux 的薪资待遇最高
3、会计打败了 R 语言和 python
4、行业传统工具 SAS、SPSS 均未上榜
回到我们之前令人咋舌的一个结论:大连给出的数据分析薪资是全国最高。我们下面来探究一下为什么会是大连当了出头鸟。
1、探究大连对学历的需求程度
按照学历分组,查看热门城市对学历的需求度。结果如下:
绝大部分热点城市就数据分析岗位发布的招聘信息,本科生的需求程度都远远大于其他层面的人群。苏州、南京、深圳就数据分析岗位发布的招聘信息,大专生的需求程度明显大于其他层面的人群。
我们探究大连的高薪资并没有从学历这个角度得到解释。无心插柳地找到了深圳数据分析薪资偏低的原因。
2、探究大连对工作经验的需求程度
按照工作年限分组,依样画葫芦的查看热门城市对工作年限的需求度。结果如下:
众里寻他千百度,终于在这里找到了答案。
大连发布的招聘心中,将近 100%都需要 5-10 年的工作经验。结合我们前面得到的“越老越吃香”的结论,解释了大连数据分析薪资全国最高的疑惑。其他几个热点城市的偏好:
成都喜欢 3-5 年的;廊坊喜欢 1-3 年的;深圳喜欢不限经验的;盐城基本都不限经验。
数据分析入门有一小段时间了,一直没有做出什么出彩的东西。这次发布的报告最主要的目的是练手。与此同时,也了解了一些关于这个行业的冷门。传统的 SAS 和 SPSS 现在在行业招聘中提及甚少,反而数据库和 Linux 大行其道。是否体现了
现在数据分析这个行业正在往容量上面走,而定量分析的方面关注度不够?现在来总结一下这次的行动:
1、不足
样本容量太小
数据采集的样本还是比较少,只有 1500 条左右。样本容量太小,导致不可控因素的放大
数据没有去重
因为没有采集发布招聘的公司的名称,就没有对同一个岗位的招聘信息进行去重。误差太大。
理论知识缺乏
现在还是只能停留在画个图,得到一眼就能看出来的结论。定量分析还很欠缺。
2、感谢
领导
我上班做这个没有开除我,反而还很支持。谢谢两位领导!!给你们生猴子!!!!
R 语言学习交流群
谢谢群里面的各位的支持,尤其是雨神!!!给你们疯狂打电话!!!!
最后,感谢阅读!