本文从当前炙手可热的算法工程师就业开始讲起,详细的和朋友们探讨一下,普通程序员如何转型成为算法工程师?
先谈钱。
有一种说法,算法工程师薪酬区间基本就是三挡:
薪酬范围
|
人才背景
|
能力特征
|
15~30W
|
科班毕业的数学系硕士研究生或有ACM铜奖以上
|
熟悉通用的模型,知道如何用合适的模型去做数据
|
40~60W
|
即上述的优秀毕业生在BAT等公司沉淀两三年后实际身价,基本对应到阿里的P6,腾讯的T3.1或者国内那TOP 5学校的博士毕业生,基本有三篇一作
|
会改造设计模型,并对新的模型进行最优化
|
100W+
|
基本就是行业科学家级别,或者对应阿里的P7/P8,百度的T7以上,腾讯的T3.2以上或者相当于姚班的IOI金牌,比如今年的陈立杰和范浩强
|
根据一个实际问题需求,可以给出量化的目标函数
|
对程序员而言,技术进步大大超过我们的想象,如果你不跟随时代进步,就会落后于时代。
似乎我们公认的程序员就是苦逼的码农搬运工,结果等磨到三到五年后,发现自己的技术已经落后,掌握的语言已经过时。看着曾经的同事都走上了有车有房的幸福之路,自己也蠢蠢欲动想要转岗,却摸不着头脑,是自学or上培训班?
这里,我们以当前热门的大数据相关岗位分析为例:
从大数据信息分别从底层基础平台、中间层通用技术、上层行业应用进行归纳
技术分类
|
行业概述
|
底层:基础平台
|
提供包括数据存储在内基础设施,Hadoop是其中最热门领域
|
中层:通用技术
|
数据管理相关技术,连接数据源与数据处理之间桥梁,包括数据采集、数据分析,可视化等数据处理技术
|
上层:行业应用
|
将数据与垂直行业进行融合,如征信、反欺诈、刑侦破案,营销推荐等
|
1. 处理器速度的加快,大规模数据处理技术的日渐成熟,使得在Big Data中快速提取有价值信息成为可能。现在,PB级别的数据也可以在短时间内完成机器学习的模拟训练。这让包括Face++、科大讯飞等这些高度依赖深度学习的图像、语音识别公司得以对产品进行快速迭代;
2. 互联网行业的快速发展,使得很多企业都存储了海量数据,如何挖掘这座数据宝库,也推动了大数据本身发展;
3. 同样,也衍生出很多数据相关公司发展,比如通过监测海量数据,做数据价值变现的TalkingData等,以及做底层架构的支持服务商阿里云、UCloud等等;
各方面的需求导致目前人才供给相对不足,供需失衡决定大数据从业人员待遇更高。
同样的,这些岗位相对于传统软件工程,也有更高的挑战空间和更大难度,也吸引更多人才进入到这个领域
分类
|
应用板块
|
代表企业
|
行业综述
|
文本挖掘
|
大数据公司通过收集互联网上各类文本信息,为企业提供更好的竞争分析、公关、用户调研等
|
智慧星光
波森数据
清博大数据
|
与网页爬虫类似,由于百度、谷歌在搜索引擎领域技术太明显,根本没机会
|
网页爬虫
|
早期百度、谷歌等搜索引擎都在使用。
|
八爪鱼
|
|
广告监测类
|
主要针对品牌客户,为企业提供广告营销全流程的数据分析
|
秒针系统
AdMaster
TalkingData
|
秒针与AdMaster占据95%市场份额
TalkingData主要针对中小企业,为中小APP软件提供广告监测在内多项运营服务
|
BI商业智能
|
更侧重人机交互,将报表形式以图像方式呈现出来
|
永洪科技
帆软
|
单纯BI与数据可视化工具,竞争优势并不大,因为其开源透明,技术门槛低,所以更多是向上层偏移,将技术与行业应用结合,形成行壁垒,比如永洪、海云等都在积极对接业务,重点布局公安、电信等行业,加强客户黏性
|
数据可视化
|
与BI一致,将报表形式以图像方式呈现出来,更侧重于数据呈现,给企业客户更清晰展示
|
海智BDP
海云数据
数字冰雹
|
|
日志分析
|
早期更多运用于信息安全领域;现阶段也开始衍生到企业业务领域,比如反欺诈等
|
除了传统安全公司,
新公司还包括日志易,瀚思安信
|
也是面临行业开源,技术门槛不高,可以关注物联网发展,将日志数据衍生到机器数据
|
移动统计
|
随着移动互联网兴起而兴起
|
TalkingData
友盟+
|
|
用户行为
|
既有掘金者,自然也有给掘金者送水的这两类
|
GrowingIO
神策数据
诸葛IO
|
最大问题是移动互联网客户是否接受付费模式
|
1. 算法工程师——这类团队面对的问题通常是明确而又有更高难度的,比如人脸识别、在线支付的风险拦截。这些问题经过了清晰的定义和高度的抽象,本身又存在足够难度,因此需要求职者在所研究问题上有足够的专注力,对相关算法有足够深度的了解。
2. 数据挖掘工程师——这类团队面对的挑战不限于一个具体问题,而在于如何将复杂的业务逻辑转化为算法、模型问题。因此不但要求工程师在算法上探索得足够深,但需要足够的交叉能力。需要了解常见的机器学习算法,同时也要有迅速理解业务的能力。
从企业对岗位的要求,我们可以分析出:
岗位名称
|
市场人才现状
|
岗位要求分析
|
算法工程师
|
人才基本被TOP企业垄断。因为TOP企业数据量很大,比如做一个几亿级别的人脸搜索
|
1. 数据结构和算法板块需要有扎实基础;
|