专栏名称: 石杉的架构笔记
专注原创、用心雕琢!十余年BAT一线大厂架构经验倾囊相授
目录
相关文章推荐
高分子科技  ·  封伟教授团队 Adv. ... ·  15 小时前  
高分子科学前沿  ·  中国科学院理化技术研究所王树涛/孟靖昕团队《 ... ·  18 小时前  
高分子科学前沿  ·  中国青年学者一作兼通讯!3D打印,最新Sci ... ·  2 天前  
高分子科技  ·  中科院纳米能源所张弛研究员团队 ACS ... ·  4 天前  
高分子科技  ·  华南师范大学胡小文 ... ·  3 天前  
51好读  ›  专栏  ›  石杉的架构笔记

公司架构师常常提起的DNS负载均衡是个什么鬼?

石杉的架构笔记  · 公众号  ·  · 2021-04-16 09:36

正文

点击上方蓝色“ 石杉的架构笔记”,选择“设为星标”

回复“PDF”获取独家整理的学习资料!

长按扫描上方 免费领取


  • 传统思路的局限性

  • CDN是怎么做的?

  • 神奇的解释权机制(SOA)

  • DNS负载均衡的基本原理

  • 总结


当网站的访问量大了就会考虑负载均衡,这也是每一个架构师的基本功了,其基本地位就相当于相声里的说学逗唱,活好不好就看这个了 :)


传统的负载均衡思路是单点的,不管你是硬件的还是软件的基本都是这样的原理,如下图所示:

对于一般的需求来说,这样的架构基本就可以解决问题了,而且维护起来也相对简单,大多数公司也都是这么干的。



传统思路的局限性

就如同上图所示,传统思路也存在非常明显的局限性。


也就是说,网站的响应速度很大程度上局限于负载均衡节点的能力,而且一旦负载均衡节点本身挂掉的话,整个网站就完全瘫痪了。


后端的服务可以水平扩展,但是对于单个节点来说就算你再增大机器的配置也是有极限的,而且这也不符合互联网技术的发展规律。



CDN是怎么做的

作为互联网上承载大部分流量的一大基础设施,CDN对负载分流的解决思路很具有启发性,如下图:

从上图可以看到,用户的访问被分流了,所有的请求不再是聚集到一个节点上,而是被分担在了各个合适的节点上。


这样即使存在单点故障,也仅仅只会影响到一部分用户,况且我们还可以使用其他手段做故障转移。


同样的做法也可以借鉴到传统的 BS 架构中,我们也可以把用户的请求直接分流到不同的服务器上,而不必经过一个统一的节点中转。


这个分流是通过什么做到的呢?


答案就是: DNS


你知道DNS是怎么工作的吗?


大部分人可能天天都用着DNS却不知道它的基本原理,你可能知道我们访问互联网需要查询dns服务器,就是下面的这个玩意



我们只需要问它域名所对应的ip地址就行了。


但事情真的这么简单吗?它是怎么知道这个域名所对应的ip地址呢?


其实dns系统是一个典型的 树状架构 ,上图所示的dns服务器其实应该叫dns缓存查询服务器,它是为了减轻互联网上dns查询的负载所设计的。


如果你的请求没有命中缓存,那么这个缓存服务器就会自己进行一次标准查询,然后再把结果缓存起来,简单来说就是从根服务器开始一级一级的问。


我们以前经常谈到根服务器的重要性其实就体现在这里了,它保留了对所有域名的起始解释权


神奇的解释权机制(SOA)

上面讲到根服务器拥有一切域名的起始解释权,但是如果你去问根服务器它是不会直接告诉你最终答案的。


因为如果它要存储所有的记录,那它也太累了,这个负载和开销是惊人的。


那它会告诉你什么呢?它会告诉你应该去问谁,也就是它授权下一级服务器来解答你的问题。


我们来看下面的拟人化过程:

  1. 我: root, root 告诉我, segmentfault.com 怎么走?


  2. root: 呵呵,你可以去问.com的dns服务器,地址是xxxxxx


  3. 我: .com, .com 告诉我,segmentfault.com 怎么走?


  4. .com: 呵呵,你可以去问segmentfault.com的dns服务器(dnspod之类的),地址是xxxxxx


  5. 我: dnspod, dnspod 告诉我,segmentfault.com 怎么走?


  6. dnspod: 拿着 xxxxxx,走你



DNS负载均衡的基本原理

了解了上述过程,我们得到两个基本结论


  1. dns系统本身是一个分布式的网络,它是相对可靠的,起码比你网站本身可靠的多


  2. dns的最终解释是可以受我们自己控制的


有了这两条结论,剩下的事情就简单了,我们只需要在最终解释的查询结果上做文章就可以了。


简单来说,就是将你的所有服务器地址,按照自己需求制定的频次,返回给用户。


以github.com为例,我们首先获取它的SOA服务器(因为dns缓存查询服务器会缓存结果,如果你直接去查询域名,会每次返回一样的结果),.com的dns域名服务器也是13台,它们是[a-m].gtld-servers.net,我们随便选一台来找找github.com的SOA.如下图:







请到「今天看啥」查看全文