专栏名称: 算法与数学之美
从生活中挖掘数学之美,在实践中体验算法之奇,魅力旅程,从此开始!
目录
相关文章推荐
九章算法  ·  最新!Dropbox裁员20%!补偿16周…… ·  昨天  
九章算法  ·  双11王炸!7天出offer!LeetCod ... ·  昨天  
新机器视觉  ·  一文了解强化学习 ·  1 周前  
51好读  ›  专栏  ›  算法与数学之美

天下为公:TCP堵塞控制

算法与数学之美  · 公众号  · 算法  · 2017-10-27 21:51

正文

在 TCP 协议中,我们使用连接记录 TCP 两端的状态,使用编号和分段实现了 TCP 传输的有序,使用广播窗口来实现了发送方和接收方处理能力的匹配,还使用重复发送机制来实现 TCP 传输的可靠性。最初的 TCP 协议就是由上述的几个方面构成。1980 年代,TCP 协议又引入了流量控制机制。




令人头痛的堵车


从 1980 年代开始,网络变得繁忙。许多网络中出现了大量的堵塞(congestion)。堵塞类似于现实中的堵车。网络被称为“信息高速公路”。许多 IP 包在网络中行驶,并经过一个一个像十字路口一样的路由器,直到到达目的地。一个路由器如果过度繁忙,会丢弃一些 IP 包。UDP 协议不保证传输的可靠性,所以丢失就丢失了。而 TCP 协议需要保证传输的可靠性,当包含有 TCP 片段的 IP 包丢失时,TCP 协议会重复发送 TCP 片段。于是,更多的“汽车”进入到公路中,原本繁忙的路由器变得更加繁忙,更多的 IP 包丢失。这样就构成了一个恶性循环。这样的情况被称为堵塞崩溃(congestion collapse)。每个发送方为了保证自己的发送质量而乱发车,是造成堵塞崩溃的主要原因。当时的网络中高达 90%的传输资源可能被堵塞崩溃所浪费。


为了弥补这一缺陷,从 1980 年代开始,TCP 协议中开始加入堵塞控制(congestion control)的功能,以避免堵塞崩溃的出现。多个算法被提出并实施,大大改善了网络的交通状况。流量控制类似于生活中的真实交通。现实中,当我们遇到堵车,可能就会希望兴建立交桥和高架,或者希望有一位交警来疏导交通。而 TCP 协议的堵塞控制是通过约束自己实现的。当 TCP 的发送方探测到网络交通拥堵时,会控制自己发送片段的速率,以缓解网络的交通状况,避免堵塞崩溃。简言之,TCP 协议规定了发送方需要遵守的“公德”。


我们先来说明堵塞是如何探测的。在 TCP 重新发送中,我们已经总结了两种推测 TCP 片段丢失的方法:ACK 超时和重复 ACK。一旦发送方认为 TCP 片段丢失,则认为网络中出现堵塞。另一方面,TCP 发送方是如何控制发送速率呢?TCP 协议通过控制滑窗大小来控制发送速率。在 TCP 滑窗管理中,我们已经见到了一个窗口限制,就是广播窗口大小,以实现 TCP 流量控制。TCP 还会维护一个阻塞窗口大小,以根据网络状况来调整滑窗大小。真实滑窗大小取这两个滑窗限制的最小值,从而同时满足流量控制和堵塞控制的限制。我们下面就来看一看阻塞窗口。




阻塞窗口


阻塞窗口总是处于两种状态的一个。这两种状态是慢起动(slow start)和堵塞避免(congestion avoidance)。下面是它们的示意图:



上图是概念性的。实际的实施要比上图复杂,而且根据算法不同会有不同的版本。cwnd 代表阻塞窗口大小(congestion window size)。我们以片段的个数为单位,来表示阻塞窗口大小 。实际应用中会以字节为单位,但并不影响这里的讲解。

阻塞窗口从慢启动状态开始。慢启动的特点是初始速率低,但速率不断倍增。每次进入到慢启动状态时,阻塞窗口大小都需要重置为初始值 1。发送方每接收到一个正确的 ACK,就会将阻塞窗口大小增加 1,从而实现速率的倍增。需要注意的是,由于累计 ACK,速率增长可能会小于倍增。


当阻塞窗口大小达到阈值(图中 ssthresh)时,阻塞窗口进入到阻塞避免状态。发送速率会继续增长。发送方在每个窗户所有片段成功传输后,将窗口尺寸增加 1,等效于每个往返时间增加 1。所以在阻塞避免模式下,阻塞窗口大小线性增长,增长速率慢。如果在阻塞避免下有片段丢失,重新回到慢启动状态,并将阈值更新为阻塞窗口大小的一半。


我们看到,触及阈值是从慢启动到 c 阻塞避免的切换点。而片段丢失是阻塞避免到慢启动的切换点。一开始阈值一般比较大,所以慢启动可能在切换成阻塞避免之前就丢失片段。这种情况下,慢启动会重新开始,而阈值更新为阻塞窗口大小的一半。

总的来说,发送速率总是在增长。如果片段丢失,则重置速率为 1,并快速增长。增长到一定程度,则进入到慢性增长。快速增长和慢性增长的切换点会随着网络状况更新。通过上面的机制,让发送速率处于动态平衡,不断的尝试更大值。初始时增长块,而接近饱和时增长慢。但一旦尝试过度,则迅速重置,以免造成网络负担。阻塞控制有效的提高了互联网的利用率,但依然不完善。一个常见的问题是阻塞窗口小在接近饱和时线性增长,因此对新增的网络带宽不敏感。




TCP 实践


TCP 协议利用流量控制机制来实现整个网络的总体效率。到现在为止,已经讲解了 TCP 的几大模块:分段与流,滑窗,连接,流量控制,重新发送,堵塞控制。现在,我们可以在编程中实际利用一下 TCP 协议。


在 Python 中,我们可以用标准库中的 socket 包来建立 TCP 连接。这个包已经用于 UDP 协议的套接字编程,它同样可以用于 TCP 协议的套接字编程。我们需要写两个程序,分别用于 TCP 连接的服务器端和客户端。一旦连接建立,双方可以相互通信。下面是服务器端的程序。我们用 bind()方法来赋予套接字以固定的地址和端口,用 listen()方法来被动的监听该端口。当有客户尝试用 connect()方法连接的时候,服务器使用 accept()接受连接,从而建立一个 TCP 连接:


# Written by Vamei

# Server side

import socket

# Address

HOST = ''

PORT = 8000

reply = 'Yes'

# Configure socket

s      = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

s.bind((HOST, PORT))

# passively wait, 3: maximum number of connections in the queue

s.listen(3)

# accept and establish connection

conn, addr = s.accept()

# receive message

request    = conn.recv(1024)

print 'request is: ',request

print 'Connected by', addr

# send message

conn.sendall(reply)

# close connection

conn.close()


上面的程序中,socket.socket()创建一个 socket 对象,并说明 socket 使用的是 IPv4(AF_INET,IP version 4)和 TCP 协议(SOCK_STREAM)。服务器写好了,下面是客户。在客户的程序中,我们主动使用 connect()方法来搜索服务器端的 IP 地址和端口,以便客户可以找到服务器,并建立连接:


# Written by Vamei

# Client side

import socket

# Address

HOST = '172.20.202.155'

PORT = 8000

request = 'can you hear me?'

# configure socket

s       = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

s.connect((HOST, PORT))

# send message

s.sendall(request)

# receive message

reply   = s.recv(1024)

print 'reply is: ',reply

# close connection

s.close()


TCP 协议是双向的。因此,我们在连接两端都可以调用 recv()方法来接收信息,调用 sendall()方法来发送信息。这样,我们就可以在分处于两台计算机的两个进程间进行通信了。当通信结束的时候,我们使用 close()方法来关闭 TCP 连接。为了展示网络通信,上面程序最好运行于两台电脑。但如果没有两台计算机做实验,也可以将客户端的 IP 改为 127.0.0.1。这是个特殊的 IP 地址,指向主机自身。这样,我们在同一台电脑上建立了 TCP 连接。




总结


流量控制要求参与 TCP 通信的各方守公德,从而提高了 TCP 通信的整体效率。这一篇的最后,还有一个实际建立 TCP 连接的例子,用 Python 语言实现。到了这里,TCP 协议的介绍就可以告一段落了。下一章我们将进入应用层。



☞  哈尔莫斯:怎样做数学研究

☞  扎克伯格2017年哈佛大学毕业演讲

☞  线性代数在组合数学中的应用

☞  你见过真的菲利普曲线吗?

☞  支持向量机(SVM)的故事是这样子的

☞  深度神经网络中的数学,对你来说会不会太难?

☞  编程需要知道多少数学知识?

☞  陈省身——什么是几何学

☞  模式识别研究的回顾与展望

☞  曲面论

☞  自然底数e的意义是什么?

☞  如何向5岁小孩解释什么是支持向量机(SVM)?

☞  华裔天才数学家陶哲轩自述

☞  代数,分析,几何与拓扑,现代数学的三大方法论

算法数学之美微信公众号欢迎赐稿

稿件涉及数学、物理、算法、计算机、编程等相关领域。

稿件一经采用,我们将奉上稿酬。

投稿邮箱:[email protected]

商务合作:微信号hengzi5809