做了多年架构设计,很多人连架构设计的关键流程和步骤都不知道。很多人确实上线了很多系统,也确实做了很多需求,但基本上都是毫无方法,全凭自己想象的在做架构设计。
总的来说,架构设计有四个大的步骤,其中第二个步骤最容易被大家忽略。
画外音:别人写文章,都说最后一个步骤最重要,我就是不按套路出牌,说第二个步骤最重要。
步骤一:理解需求以及定义系统边界。
Understand the problem & Identify the scope of the system.
理解需求,核心是和产品确定功能要求,以及根据业务确定性能要求。
定义系统边界,核心是要明确系统哪些要做,哪些不做。
步骤二:也就是最容易被忽略的一个步骤,调研已有的类似的系统。
Research on existing systems.
你做的系统,是业内首创吗?如果不是,看看类似的系统是怎么做架构设计的。参考成熟的方案,能让你的架构设计事半功倍。
步骤三:顶层设计。
high-level architecture design.
设计系统的主要组件,以及它们之间的交互方式。例如:
使用机房,还是云?
使用单体,还是微服务?
要不要cache,要不要mq?
用rdb,还是nosql?
...
这里要包含系统架构的粗略图,以及实现核心需求的流程图。
步骤四:也是非常重要的一个步骤啊,解决主要矛盾迭代设计。
Refine the design.
顶层设计完之后,哪里是系统的主要矛盾?
我们要根据潜在的主要矛盾,细化与迭代顶层设计。
例如:你要做一个计数系统,对推文的阅读,转发,点赞,评论数进行计数。
假如主要矛盾如果是并发,1秒10万次?
那可能就要加入一些乐观锁,异步,批量请求,Copy On Write等巧妙设计,甚至牺牲一些一致性。
那可能就要加入一些互斥,校验,write-ahead logging等巧妙设计。迭代设计,解决完一个主要矛盾,继续解决次要矛盾,直到所有的功能需求与性能需求得到满足。这里面有个地方要注意:在第四步迭代设计的过程中,有可能会发现第三步顶层设计的缺陷。这个时候,可能要优化甚至推翻第三步顶层设计。这也是为什么,一些系统运行了几年,就要进行重构。当初的顶层设计已经满足不了现有的业务需求了。在原有顶层设计基础上,解决不了主要矛盾了,那就重构顶层设计来解决。其二,架构不只是设计而来的,更是迭代与演进而来的;这两个架构理念,我会在接下来的100个架构知识点里反复提及。假如业务需求是:“我想做一个1万属性,100亿数据,每秒10万吞吐的分类信息平台,像58同城一样,2个月实现”。招聘、房产、二手、二手车、黄页... 品类繁多,帖子schema不固定...
帖子发布,帖子浏览,帖子搜索(每个属性都可能被搜索)...数据量巨大,吞吐量巨大,用户实时访问,请求延时敏感...国外信息分类做得最好的应该是 Craigslist 了,网上调研一些相关的资料,可以了解到,其核心的一些关键设计点:利用 MongoDB 的 schema-free 特性...早期利用 MongoDB 的索引,后期利用搜索服务...
数据水平切分,逻辑处理服务化,集群化,缓存降低数据库压力...
宏观上,结合 Craigslist 的一些成熟实践:主要矛盾1:多品类帖子数据的分开存储,使得核心业务流程及其复杂,怎么解?
潜在方案:统一帖子中心服务IMC(Info Management Center)。
主要矛盾2:多品类帖子属性的分级,扩展与校验,怎么解?
潜在方案:统一分类管理服务CMC(Category Management Center)。主要矛盾3:大数据量,高并发,跨品类的多属性搜索,怎么解?
这里,是一个架构设计过程的案例演示,主要用以说明设计流程。具体“1万属性,100亿数据,每秒10万吞吐的分类信息平台”的设计细节,详见后文的补充阅读资料。
其三,顶层设计,定义核心组件与交互;
其四,针对主要矛盾迭代设计;
有人问,第二步借鉴已有成熟系统的方案,在别的架构设计方法中,没有看到过这个步骤呀?莫不是搞笑的吧。
我非常严肃地声明,这个步骤非常重要,调研一定要多花时间。不行的程序员,看谁的代码都是屎;不行的架构师才会认为,我的方案最牛逼,别人的方案都是屎,但其实,自己原创的大部分方案才是屎。
保持开放的心态,借鉴优秀的方案,是优秀架构师的核心品质。
“借鉴”这一点,任何不接地气的架构方法,都不会有人说。
如《接下来,准备干一件大事...》所述,后续我将以短视频+图文+直播+星球社群的形式,系统性的分享自己的架构师之路,架构设计中的100个相关知识点,欢迎感兴趣的童鞋关注。今天这是第二篇,码字有点慢,等不及的童鞋,先看短视频吧。
短视频已经发布第三篇,《何时优化延时?何时优化吞吐量?》,这是大规模系统架构优化中,找主要矛盾,找优化点的架构师必备技能。希望大家能有收获。