HTTP 编年史

文章目录

1. HTTP/0.9
2. HTTP/1.0
3. HTTP／1.1
4. HTTP/2
5. 总结
6. 顺便提一句
7. 参考链接

HTTP 协议作为应用层重要的网络协议，同时也随着时代的发展不断演进。从最初的 HTTP/0.9 到 HTTP/1.0 再到 HTTP/1.1 以至于到现在的最新版本 HTTP/2 。每个版本的演进都是为了解决网络传输协议中的痛点，下面就来总结下每个版本到底都更新了些什么。

HTTP/0.9

HTTP 的 1991原型版本，这个原型版本定义的初衷是为了传输简单的HTML对象，因此在设计上有很多严重的缺陷，例如：

只支持GET方法
不支持多媒体内容的MIME类型
不支持 HTTP HEADER

正是因为这些硬伤，所以这个版本存活没多久就被新的版本取代了。

HTTP/1.0

既然是新的版本，那么上一版本的这些硬伤就应该被妥善解决。
因此 1.0 版本新增：

支持多媒体格式文件（图片、视频等）的传输
支持更多除了GET之外的HTTP方法（POST）
添加状态码（例如： 200 OK，301 move permanently ， 404 not found，500 internal server error 详细内容参见这里）
多字符集，multi-part type, 版本号等功能支持
HTTP HEADER

那么这个版本又有什么问题呢？

每个TCP连接只能发送一个请求，数据发送完毕后连接就关闭了，如果要请求其他资源就需要重新建立连接。换句话说就是不支持后来的持久连接 keep-live 功能。
不支持虚拟主机和代理连接功能。

HTTP／1.1

同样上个版本的硬伤，下个版本都需要妥善地解决。
因此，1.1版本新增：

持久连接（persistent connection），并且规定对于同一个域名（这里同一根域名下的子域名属于不同域名）允许同时建立6个连接。
管道机制（pipelining）
在没有管道机制之前，假设完成一个操作需要一系列的请求（例如[A,B,C,D]）需要A发送请求并完成数据传输后，B才能发送请求，依次类推。
引入了pipelining机制后，允许B可以在A没有收到数据的情况下发送请求，但是服务端还是会按照A，B的顺序响应，先处理完A的请求后再处理B的请求。
由于一个持久连接会有多个回应，就有必要区分数据包是属于哪个回应的，对应的就有 content-length , Transfer-Encoding等机制来保证。
增加更多HTTP方法（PUT，PATCH，DELETE，HEAD，OPTIONS）

那么这样一个改进的版本会有什么问题呢？
主要还是持久连接上的问题，你会问：持久连接解决了频繁创建连接的高代价问题，管道机制解决了请求必须顺序发送的时序问题，似乎主要问题得到了解决，但是，注意但是来了，这些做法只是从连接的发送方来解决，服务方依然是按照顺序依次处理请求。这就会有排队现象，这个处理慢的请求会拖慢整个网站速度，尤其是这个慢的请求越靠前影响越大。所以说现有流行的http版本的问题会是“排队等待阻塞问题”

那这个问题在新版本出现之前是怎样解决的呢？

比如压缩css、js文件，减小网络传输数据量。
合并小文件，减少请求数量。
域名分片（domain sharding）

这里单独拿出域名分片来说一说：
上面不是说到每个持久连接下不是有6个域名同时建立连接的限制么？
我们聪明的工程师想到，好像我们可以用这6个域名搞事情。比如说有这样一个例子：现在有个网页上面会有3个比较大的图片文件，如果这三个文件放在同一个持久连接下，那么这三个文件会依次获得从服务器的响应。如果我们将这三个图片放在不同的域名下然后分别创建持久连接，那么这里就解决了请求排队等待的问题。
上面的这种做法你会发现在很多主流的网站都有使用，后来这也成为大流量、对网站响应速度有高要求的站点的网站优化常用手段。
注意到什么问题么？似乎这个解决方案解决了排队等待阻塞的问题，但是它是用创建新的持久连接为代价来做的，这种方案适用的场景还是属于创建连接代价小于排队代价的场景。这种优化其实也是一种trade off。
说到底，这个排队等待阻塞的问题在HTTP/1.1版本内还是一个痛点。那我们就只有寄希望于后续版本从根本上解决这个问题。

HTTP/2

HTTP/2 是2015正式发布。
HTTP/2最激动人心的部分莫过于使用了

多路复用的通信方式
这一通信方式的改变，从根本上解决了“排队等待阻塞”的问题。
说的这么好，那么多路复用到底是怎样工作的呢？
举个例子，一个连接上会有A，B两个请求，如果未使用多路复用的通信方式的时候，那么A，B可以依次发送请求，由于服务端是按照顺序依次处理请求的，所以B一定是等到服务端返回A的数据之后才接收到数据。这样是不是很低效？
那么使用了多路复用后又是怎样的情况呢？
A，B发送完请求后，服务端会首先将已经处理好的请求返回，而并不是必须等待A完成后再发送B，这样其实是打乱了返回数据包顺序的限制，从而使队列不再等待。
数据流
由于上面的数据包返回不再按照请求的顺序返回，因此需要使用一种机制来标记数据包属于哪个请求，在这样的需求下就诞生了“流”的概念。
一个请求的的所有数据包被称为流，每个流都有一个唯一的ID编号，这样就区分出了数据包属于哪个流。
同时HTTP/2 还规定可以在不关闭连接的情况下取消数据的传输，这个在之前的版本是想都不敢想的。
既然顺序已经放开，那么可以要求重要的流数据优先传输么？当然可以，HTTP/2 支持流优先级的设定。
二进制协议
HTTP/2之前 HTTP HEADER 部分都是以文本的形式传输，而BODY部分可以选择使用文本或者二进制的方式传输。
而到了HTTP/2 HEADER和BODY部分都需要使用二进制传输，并且统称这些为帧，一是减小网络传输数据量，另一个是为了之后协议的扩展打基础。
HEADER 信息压缩
由于HTTP是不带有状态的，每次请求必须附上所有信息。这样就造成HEADER的一部分信息重复。
HTTP/2在HEADER部分引入 header compression 机制。使得HEADER信息传输更有效率。
服务推送（server push）
HTTP/2 允许服务器未经请求，主动向客户端发送资源，这叫做服务器推送（server push）。

总结

我们纵观HTTP协议的发展历史，从原型版本的HTTP/0.9 到功能基本完整的 HTTP/1.0 再到通信方式改进的 HTTP/1.1 再到性能大幅提升的 HTTP/2.0 这俨然是一个软件迭代发展的路径。
原型阶段的协议只是为了支持简单的html文本信息传输。
到了1.0版本可以支持多媒体文件的传输、状态码、HEADER以及更多HTTP方法使得这个正式的版本能够满足多媒体的互联网传输需求。
再到1.1版本大家发现随着文件越来越大，传输速度成为制约互联网发展的瓶颈，于是便有了持久连接和管道机制的解决方案。
不断变化的环境促使人们不断追寻更高效的传输方式，于是便有了多路复用的HTTP/2。
相信在不久的将来还会有更高效的HTTP版本的协议出现。

顺便提一句

是不是HTTP/2 就是最高效的呢？
答案显然是否定的，注意到HTTP协议其实是应用层的协议，以上的演进也都是在这个层面展开的，那么在它下一层传输层的协议是否有提升空间呢？
是的于是就有了基于UDP协议封装的一个高效可靠传输协议QUIC

参考链接

阮一峰博客
 孙宁GDGFest分享