在我们的生活中,当你用微信聊天时你在制造缓存数据,当你用高德地图导航时你在制造GPS数据,当你用某宝、某会、某网站购物时你在制造个人消费数据,你用电脑的时候,你用iPad的时候......
无时无刻不在制造数据。
而这些数据在“数据大师”的分析下,将会给我们的生活带来巨大变化,为企业带来更有前途的商机。如今
90%的企业都在运用
或者都想要利用大数据为其带来更便利的服务,从而
大数据高端软件类人才可谓供不应求。
图片from网络
据职业社交平台LinKedln发布的《2016年中国互联网最热职位人才报告》显示,大数据分析师已成为当下中国互联网行业需求最高的六类人才职位之一。
报告表明大数据分析
人才供给指数仅为5%
,属于高度稀缺。此外,大数据分析人才的跳槽速度也最快,平均跳槽速度为19.8个月。
根据中国商业联合会数据分析专业委员会统计,
未来中国基础性大数据分析人才缺口将达到1400万。
为什么大数据分析师的薪资越来越高,大概也有一部分这个原因吧。
据了解,在美国的大数据分析师平均薪资已
高达17.5万美元
,而国内互联网公司,例如BAT,大数据分析师的薪酬可能要比同一个级别的其他职位要高出20%-30%左右,并且备受企业关注。
当下IT行业最火的莫过于
AI+Big Data
这两个行业,即人工智能、大数据。关于这两个行业的名词定义大家可以百度查阅,在此我就不废话了。
图片from网络
很多人都会有个疑问,零基础能学好大数据吗?零基础怎样才能高效的学习大数据呢?零基础当然是可以学好大数据的,
年薪百万也都是从基层一层层渐渐走向高处的。
所以今天我们就来探讨探讨年薪60万的大数据分析师是怎样从零基础走到今天的。
今天有幸访问到
北风网金牌讲师张老师
,
张老师具有五年数据分析、数据挖掘经验。参与过
大型互联网、网游、金融
等行业的数据挖掘工作,熟悉电子商务数据分析与挖掘,擅长基于客户关系管理的数据挖掘、数据可视化、文本挖掘。
张老师本人
张老师精通
SPSS、Excel等数据分析软件,
现任北风网数据分析师讲师,获得
首批教师资质考核认
证。
今天就由张老师通过观察学员的
学习、发展、就业
后来告诉大家那些年薪60万以上的数据分析师都是怎样炼成的。
接下来欢迎张老师的分享:
首先,
年薪60万的打数据分析师并不是一步登天,
在你
什么都不懂
的情况下,打好基础很重要,而大数据的基础包含以下十几个学习重点:
1、
Bloom Filter过滤器数据分片与路由
:挑一个典型的分区算法去学习,比如一致性哈希算法。
2、备份机制与
一致性
。
3、学习
CAP理论
。
4、
幂等性
:现在很多的分布式系统状态管理的基石。
5、各种一致性模型,例如:强一致性、弱一致性、最终一致。
6、
备份机制
:主从的叫法已经不怎么流行了,当前更cool的叫法7、是Leader-Follower模式。
7、共识协议:在咱们国家通常翻译成一致性协议。只要学习常见的几种就可以:
Paxos或者Raft。
8、算法和数据结构。
9、LSM:学习和
B+树
的区别以及优势。
10、
压缩算法
:1,找一个主流的压缩算法进行了解,例如Snappy, LZ4。
11、
Bloom Filter过滤器
。
不止这些,还要学习统计学的至少八项知识:
1、集中趋势(Central Tendency)
2、变异性(Variability)
3、归一化(Standardizing)
4、正态分布(Normal Distributions)
5、抽样分布(Sampling Distributions)
6、估计(Estimation)
7、假设检验(Hypothesis testing)
8、T检验(T-test)
看了以后是不是觉得头都大了?
没关系接着看下去将会告诉你如何将课程简单化学习。
以上基础知识不管你是想成为一个大数据分析师还是大数据科学家都必须掌握。
图片from网络
在掌握基础知识以后你就可以选择一个发展方向,大数据行业分为两大方向发展:
1、大数据分析
2、大数据工程
这两种角色
相互产生交集又独立运作,
如果没有大数据超级工程,大数据分析这个角色便无任何意义;
没有大数据分析,大数据工程也没有存在的意义和理由。
这就相当于结婚和恋爱,恋爱的最终是目标就是结婚,不以结婚为目的的恋爱就是是耍流氓,道理都一样。
大数据工程需要的是处理数据的
定义、收集、计算与保存工作,
所以大数据建设者们在设计和部署这样的系统时首先考虑的应该是数据高可用的问题,这段话可以理解为
大数据工程系统需要随时地为分析系统提供数据服务。
而
大数据分析角色的定位于如何利用数据,
可以理解成从大数据工程系统中接收到的数据之后,如何为企业提供数据分析,并且能够帮助到企业或者公司进行
业务改善和提升服务水平的目的,
因此对于大数据分析师来说,首要解决的问题是发现并且利用数据的价值,
具体包括:趋势分析、模型建立以及预测分析
等。
图片from网络
当你想成为一名资深大数据分析师,以下就是必备技能:
1、
数学功底
:微积分是严格要掌握的。一元微积分是必须要熟练掌握并使用的。线性代数要精通,矩阵的运算、向量空间、秩等概念。
2、回顾同济版《高等数学》,有能力的可以去Coursea学习宾夕法尼亚大学的
微积分课程。
3、推荐学习Strang的线性代数:
《Introduction to Linear Algebra》
4、数理统计:概率论和各种统计学方法要做到基本掌握,找一本
《概率论》
重新学习下。
5、
交互式数据分析框架
:这里指的是Apache Hive或Apache Kylin这样的分析交互框架,首先学习Hive,有时间的话了解一下Kylin以及背后的数据挖掘思想。
6、
机器学习框架
:我建议可以从机器学习算法的原理来进行学习,看到机器学习的框架,我觉得大家应该能想到很多种,比如TensorFlow、Caffe8、Keras9、CNTK10、Torch711等,这里领衔的是TensorFlow。建议大家选取其中的一个框架进行学习。
7、入门级的
机器学习
课程。
8、学习
Python
的scikit-learn。
吴恩达的书:《Machine Learning Yearning》
推荐理由:浓缩的精华,干货十足
图片from网络
当你想成为一名大数据工程师,以下是必备技能:
1、一门JVM系语言 ,建议先学习
Java或Scala。
2、
计算处理框架
:严格来说,这分为离线批处理和流式处理,建议学习Flink、Spark Streaming或Kafka Streams中的一个。
3、分布式存储框架:建议学习
HDFS
。
4、资源调度框架:建议学习
YARN
。
5、分布式协调框架:建议学习
Zookeeper
——太多大数据框架都需要它了,比如Kafka, Storm, HBase等。
6、
KV数据库
:典型的就是memcache和Redis了,特别是Redis简直是发展神速,建议学习Redis,如果C语言功底好的,最好熟读源码,反正源码也不多。
7、列式存储数据库:建议学习
HBASE
,这是目前应用最广泛的开源列式存储。
8、消息队列:大数据工程处理中消息队列作为
“削峰填谷”
的主力系统是必不可少的,当前该领域内的解决方案有很多,包括ActiveMQ,Kafka等。
建议学习Kafka,
不仅仅好找工作,还能触类旁通进一步理解基于备份日志方式的数据处理范型。
图片from网络
基础知识+研究深入学习+多年从业经验=大数据分析师/大数据工程师
但是还不够达到年薪60万的标准。对数据分析师来说30W就是一个坎,当你的经验值达到了这个坎,很快就会跨越到60W第二个坎,这个经验值就是
工龄
。
你从事行业的时间越久,就会得到更多项目的锻炼,在这个基础上你还保持着不断学习的精神,其实就不止停留于60W这个坎了,所谓
活到老学到老。
根据领英统计的数据显示,有
21.7%的数据分析师收入在2万到3万元
,18.1%的月收入在1万到1.5万,并且薪资是随着工龄而增加,
增幅逐年上涨,时间越长,差距越大。
大家看了以上学习内容后可以登录
www.ibeifeng.com
查看
“零基础大数据”、“大数据”“大数据、云计算”
相关课程查阅,这三门课程分别从三个不同层次(零基础、有经验、资深专家),
很多自学的同学不妨将这些课表down下来参考参考,
然后给自己制定一条合理的学习路线。
说到自学,其实很少有数据分析师是完全靠着自学之路走上人生巅峰的,更多的是:
系统课程学习(培训)+自己的勤奋努力+前辈的指导+学习资源不断更新=年薪60万的数据分析师。
虽然不是万能公式,但这是一般模式。
图片from张老师
张老师送给大家一句话:
“学习大数据分析只有在
互动、交流、项目实战中你才能与时俱进,而不是画地为牢只会啃书本。”
再此张老师的分享就此打住,感谢老师的倾情分享,让大家更清晰的知道了大数据分析师的学习路线。
文末就该有彩蛋呀!
小编特意向张老师为广大粉丝谋得一福利:
免费报名
“大数据分析师的黑马之路”课程
课程详情及报名方式:
点击【
阅读原文
】:
填写
申请信息
即可免费报名参加
11月7日、9日
由
张老
师主讲
价值
6
99元
的
大数据分析师
内部课程,
点击【
阅读原
文】查看课程内容并申请报名。
限额
5
0名
!
速速申请,名额有限。
这两个板块将会照顾到零基础同学,在课程讲解中告诉你如何高效学习。通过数据实战学习,以达到入行小白到初级分析师的思维转换。
这里有个不关注会后悔的二维码
不定期
分享技术干货