一直听别人说HTTP长连接,只知道长连接比短连接更节省资源、更快捷,但是并不真的知道原因。知其然不知其所以然,对于技术来说,这种状态是比较危险的。所以,还是要挖一下原理,即使挖的比较浅,也要迈出这一步。

HTTP是应用层协议,传输层使用的是TCP协议,网络层使用的是IP协议。

IP协议主要解决网络路由和寻址问题,TCP协议主要解决如何在IP层之上可靠的传递数据包,使在网络上的另一端收到发送端发出的所有包,并且顺序与发出顺序一致,HTTP协议主要基于TCP协议完成数据传递。

OSI参考模型与TCP/IP模型

首先说下TCP连接与断开。

TCP的生命周期被戏称为三次握手和四次挥手,每次握手(挥手)都需要通信双方交互数据,所以TCP连接传输数据是比较耗费资源的,也就是通常所说的成本较高。

TCP的三次握手和四次挥手

然后,HTTP协议是无状态的、面向连接的,即协议本身不具备记忆能力,两次不同的HTTP请求之间没有任何联系。

在HTTP/1.1之前,一个网页加载资源的时候,每需要加载一个资源,就需要进行一次HTTP请求,建立一次连接,请求结束就断开连接,而每次连接(TCP连接)都需要耗费资源(时间资源、网络资源等)。

所以后来在HTTP/1.1中引入持久连接(persistent connection),即TCP连接默认不关闭,可以被多个请求复用,不用声明Connection: keep-alive,也就是常说的长连接。

这里所说的长连接,其实本身是TCP长连接。比如发起一次HTTP请求时,客户端与服务端创建TCP连接,在得到响应结果后,不进行TCP的四次挥手断开连接,而是会保持一段时间的TCP连接。此时,如果又有一次HTTP请求相同的服务端,就会继续使用这一个TCP连接。这样,节省了TCP连接的消耗。

当然,为了资源的有效利用,在一段时间(超时时间,请求头中Keep-alive: timeout=10进行设置)没有活动时,客户端或服务端会主动断开TCP连接。建议的做法是,在客户端最后一次请求时,请求头中发送Connection: close,明确要求关闭TCP连接。


补充下TCP三次握手、四次挥手的知识。

三次握手建立连接:

  1. 第一次握手:客户端发送SYN包(seq=x)到服务器,并进入SYN_SEND状态,等待服务器确认;
  2. 第二次握手:服务器收到SYN包,必须确认客户的SYN(ACK=x+1),同时自己也发送一个SYN包(seq=y),即SYN+ACK包,此时服务器进入SYN_RECV状态;
  3. 第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ACK=y+1),此包发送完毕,客户端和服务器进入ESTABLISHED状态,完成三次握手。

握手过程中传送的包里不包含数据,三次握手完毕后,客户端与服务器才正式开始传送数据。理想状态下,TCP连接一旦建立,在通信双方中的任何一方主动关闭连接之前,TCP 连接都将被一直保持下去。

四次挥手断开连接

  1. 第一次挥手:主动关闭方发送一个FIN,用来关闭主动方到被动关闭方的数据传送,也就是主动关闭方告诉被动关闭方:我已经不会再给你发数据了(当然,在FIN包之前发送出去的数据,如果没有收到对应的ACK确认报文,主动关闭方依然会重发这些数据),但此时主动关闭方还可以接受数据。
  2. 第二次挥手:被动关闭方收到FIN包后,发送一个ACK给对方,确认序号为收到序号+1(与SYN相同,一个FIN占用一个序号)。
  3. 第三次挥手:被动关闭方发送一个FIN,用来关闭被动关闭方到主动关闭方的数据传送,也就是告诉主动关闭方,我的数据也发送完了,不会再给你发数据了。
  4. 第四次挥手:主动关闭方收到FIN后,发送一个ACK给被动关闭方,确认序号为收到序号+1,至此,完成四次挥手。

注意:中断连接端可以是Client端,也可以是Server端。

详细的状态说明

  • SYN_SEND:客户端尝试链接服务端,通过open方法。也就是TCP三次握手中的第1步之后,注意是客户端状态
  • SYN_RECEIVED: 服务接受创建请求的SYN后,也就是TCP三次握手中的第2步,发送ACK数据包之前。注意是服务端状态,一般15个左右正常,如果很大,怀疑遭受SYN_FLOOD攻击
  • ESTABLISHED:客户端接受到服务端的ACK包后的状态,服务端在发出ACK在一定时间后即为ESTABLISHED
  • FIN_WAIT1:主动关闭的一方,在发出FIN请求之后,也就是在TCP四次挥手的第1步
  • CLOSE_WAIT:被动关闭的一方,在接受到客户端的FIN后,也就是在TCP四次挥手的第2步
  • FIN_WAIT2:主动关闭的一方,在接受到被动关闭一方的ACK后,也就是TCP四次挥手的第2步。可以设定被动关闭方返回FIN后的超时时间,有效回收链接,避免syn-flood.
  • LASK_ACK:被动关闭的一方,在发送ACK后一段时间后(确保客户端已收到),再发起一个FIN请求。也就是TCP四次挥手的第3步
  • TIME_WAIT:主动关闭的一方,在收到被动关闭的FIN包后,发送ACK。也就是TCP四次挥手的第4步