点击上方
"
蓝字",
右上角
选择“设为星标”
周一至周五早8点半!精品技术文章准时送上!
公众号后台回复 “
学习
” ,获取作者
独家秘制
学习资料
目录
1、业务背景介绍
2、架构演进考察
3、对公司底层技术的原理考察
4、系统难点的考察
5、擅长技术的考察
6、总结
“
这篇文章,给大家分享一个同学面试阿里某个部门时的经历。
简单说一下这个同学面试的背景,本身技术底子还不错,在几个有一定知名度的中型互联网公司工作过,然后之前打算尝试一下阿里的职位,就去面试了。
第一轮和第二轮面试,全部都通过了,面试官评价也是基本技术素养还可以,基础也不错,定级都是P6+的职级。
但是第三面是那个部门老大P9出来面试他,结果就挂在这里了,所以把这个第三面的一些问题分享出来,给大家参考。
首先这个同学上来先阐述了一下自己的一些项目经历,当前他在公司里主要是负责一个数据类的系统,业务逻辑并不复杂,但是有一点技术难度。
主要是每天都会有人调用他的接口,然后有数据会落入数据库表中。
简化一下来说,大概是这个背景,如下图:
这个系统每天接口调用大概会落入数据库中有20万左右的数据量,那么每个月大概是600万左右的数据量,每年大概是近亿级的数据量会落入数据库中。
但是这是针对整个数据库来说的,平摊到里面核心的每个表,大概每个表每年新增个千万级别的数据量。
系统就是这么个情况,接着面试官就开始发问了。。。
现在你的系统压力其实不大,每天20万新增数据量也不大,每年哪怕单表新增千万级数据其实也还算可以接受。
第一个问题:
如果假设你的系统承载的业务量翻了10倍,每天新增200万数据,你的系统架构要如何演进?
如果你的系统承载的业务量翻了100倍,每天新增2000万数据,你的系统架构要如何演进?
这
个。。。我们还没这种需求,所以我暂时还没想过这个问题。。。
心想:(这小伙子想面P6+ ?那是资深Java职位,起码得有点架构演进的意识吧,怎么一点意识都没有
)
旁白解读
实际上这类问题在BAT、美团、京东等大公司里面试,都是常问的,为什么呢?
因为大公司里的系统面对的就是业务经常翻倍的增长,系统压力越来越大,所以每年都要做几次技术升级,一直要进行架构演进。
所以在互联网公司里,架构设计能力中非常关键的一环,就是针对业务增长,架构演进的能力是非常核心的。
你要有一个意识说如果你的业务量10倍增长,100倍增长,你的系统架构要如何演进?这几乎是资深工程师必须要有的一个意识和能力。
其实大家可以思考一下,如果10倍增长,单表每年新增近亿数据,还能用单库单表的方式来承载吗?
肯定不行了,所以必然针对10倍增长的场景,需要引入分库分表的技术,保证每个库每个表分散一定的数据量,避免单表单库数据量过大。
那么大家再思考一下,如果100倍增长呢,每年单表新增近10亿数据,你分库分表也不一定够了。因为此时可能会有高并发访问的问题,数据库抗起来很吃力。
此时,你要不要考虑数据异构、冷热分离等数据存储的架构设计?
比如采用MySQL分库分表 + 分布式NoSQL数据库 + Elasticsearch分布式搜索 + Redis缓存的架构,来整体设计这个数据存储架构。
你可以先做冷热分离的架构,比如最热的数据放入分布式NoSQL数据库,专门承载当日数据的高并发写入,以及高性能的读写。
然后每过一段时间,做数据归档,把NoSQL里不再频繁使用的冷数据迁移到MySQL里去归档。
最后就是应对海量数据的检索,可以把索引构建在Elasticsearch里来应对,但是从NoSQL+MySQL的异构存储来提取明细数据即可。
而且针对一些特别热查询的数据,可以依托Redis做一个缓存。
其实那个P9面试官的面试评价里,期望的也是候选人把这一套架构说出来。虽然P6+的职级不一定说有能力完全hold住这个架构,但是起码要有这个意识。
结果候选人完全什么都说不出来,那当然会让人很失望了。
这位同学他们的系统有一部分的数据是放在特殊存储服务里的,用的是云平台上的存储服务,而且存放在存储服务里的数据还是很核心的数据。
所以面试官就开始问第二个问题了。
你能说说你对这种特殊存储服务的理解吗,他的原理是什么?
你们用的云平台上的服务存储他的架构是什么样的,你们的存储是如何规划的?
我。。。一般是调用API往里面写数据,详细的还没太多关注过
心想:( 搞什么鬼,核心数据放这种特殊的存储服务里,结果从没关注过,起码也得了解一下他的原理,把人家的文档仔细看几遍吧 )
( 而且对于自己的存储是如何规划的,容量是否充足,他是怎么扩容的,怎么什么都不知道 )
旁白分析
这是该同学犯的第二个错误,不说资深工程师,就说作为一个高级工程师,应该对自己负责的系统使用到的方方面面都有一定的了解。
比如你要是用了语音转换API,或者是快递公司的查询API,那你起码知道人家背后大致在干什么,或者问清楚人家API的QPS极限,以及你们的访问量是多少。
你们用了特殊的存储服务,起码知道那种存储服务的实现原理是什么,存储的容量规划等等问题,这是一个高级工程师hold住自己工作的起码工作素养。
面试气氛尴尬,不过仍然继续。。。
我想想(思索10秒后)。。。好像没什么难的,主要就是一些接口,然后数据就落入数据库了。。。
大公司面试一定会问你
系统的难点是什么
,这代表你的项目经验有多少含金量。
哪怕你们项目很low,你硬凑平时也得想办法弄点新技术进去,没难点也要凑点儿难点出来,否则去面试必然给人鄙视。
举个例子,比如上面的这个系统,实际上他有一个步骤是要做数据迁移,也就是说把数据库里可能几百万数据量,一次性迁移到另外一套存储里去
那么这个数据迁移的步骤,其实涉及到千万级的数据量迁移。
你如何保证数据迁移的效率?如何保证迁移后的数据准确性?在迁移的过程中如何避免影响数据库的性能?
像这些问题,其实你平时都应该考虑一下,作为一个技术难点好好阐述一下吧。