您现在的位置:首页 >> 前端 >> 内容

HTTP学习笔记:HTTP协议基础

时间:2017/1/7 9:23:00 点击:

  核心提示:无状态协议HTTP是一种不保存状态,即无状态协议。HTTP协议自身不对请求和响应之间的通信状态进行保存。也就是说在HTTP这个级别,协议对于发送过的请求或响应都不做持久化处理。HTTP方法GET:获取...

无状态协议

HTTP是一种不保存状态,即无状态协议
HTTP协议自身不对请求和响应之间的通信状态进行保存。也就是说在HTTP这个级别,协议对于发送过的请求或响应都不做持久化处理。

HTTP方法

GET:获取资源

GET方法用于请求访问已被URI识别的资源。指定的资源经服务器端解析后返回响应内容。

POST:传输实体主体

POST方法用来传输实体的主体
虽然用GET方法也能传输实体的主体,但一般使用POST方法。
虽然POST和GET方法类似,但是POST的主要目的不是获取响应的主体内容。

PUT:传输文件

PUT方法用来传输文件,要求在请求报文的主体中包含文件内容,然后保存到请求URI指定的位置。

但是HTTP的PUT方法自身不带验证机制,任何人都可以上传文件,存在安全性问题,因此不常使用。

HEAD:获取报文首部

HEAD方法和GET一样请求资源,只是不返回报文主体部分,而只返回响应首部。用于确认URI的有效性及资源更新的日期时间等。

DELETE:删除文件

DELETE方法用于删除文件。

但是和PUT方法一样,HTTP的DELETE方法本身也不带验证机制,因此也不常单独使用。

OPTIONS:询问支持的方法

OPTIONS方法用来查询 针对请求URI指定的资源 支持的HTTP方法。

TRACE:追踪路径

TRACE方法是让web服务器端将之前的请求通信环回给客户端的方法。

发送请求时,在Max-Forwards首部字段中填入数值,每经过一个服务器就将该数字减1,当数值刚好减到0时,就停止传输,最后接收到请求的服务器端则返回状态码200 OK的响应。

客户端通过TRACE方法可以查询发送出去的请求是怎样被加工修改的。TRACE方法就是用来确认连接过程中发生的一系列操作。

CONNECT:要求隧道协议连接代理

CONNECT方法要求在与代理服务器通信时建立隧道,实现用隧道协议进行TCP通信。主要使用SSL和TLS协议把通信内容加密后经网络隧道传输。

持久连接

HTTP协议的初始版本中,每进行一次HTTP通信就要断开一次TCP连接。
但是在一些请求多个资源的文档中,每次的请求都会造成武威的TCP连接建立和断开,增加通信量的开销。

为了解决上述TCP连接的问题,HTTP提出了持久连接,其特点是只要任意一端没有明确提出断开连接,则保持TCP连接状态。

持久连接的好处在于减少了TCP连接的重复建立和断开所造成的的额外开销,减轻了服务器端的负载。

在HTTP1.1中,所有的连接都默认是持久连接。

管线化

持久连接使多数请求以管线化方式发送成为可能。
从前发送请求后需等待并收到响应才能发送下一个请求。管线化技术出现后,不用等待响应亦可直接发送下一个请求。这样就能做到同时并行发送多个请求,而不需要一个接一个地等待响应了。

Cookie

HTTP是无状态协议,他不对之前发生过的请求和响应的状态进行管理。无状态协议有它的优点,由于不必保存状态,自然可减少服务器的CPU及内存资源的消耗。

而为了记住并管理状态,就引入了Cookie技术。Cookie技术通过在请求和响应报文中写入Cookie信息来控制客户端的状态。

Cookie会根据从服务器端发送的响应报文内的一个Set-Cookie的首部字段信息来通知客户端保存Cookie。 当下次客户端再往该服务器发送请求时,客户端会自动在请求报文中加入Cookie值后发送出去。 服务器端发现客户端发送过来的Cookie之后,会去检查究竟是从哪一个客户端发来的连接请求,然后对比服务器上的记录,最后得到之前的状态信息。

HTTP报文

用于HTTP协议交互的信息被称为HTTP报文。
客户端的HTTP报文为请求报文,服务器端发出的则为响应报文。
HTTP报文本身是由多行数据构成的字符串文本。

HTTP报文大致可分为报文首部和报文主体两块。报文主体不一定有。

请求报文和响应报文的首部内容由以下数据组成:

请求行/状态行
请求报文的请求行包含用于请求的方法、请求URI和HTTP版本
响应报文的状态行包含表明响应结果的状态码、原因短语和HTTP版本

首部字段
包含表示请求和响应的各种条件和属性的各类首部。
一般有4种首部:通用首部、请求首部、响应首部、实体首部

编码

HTTP在传输数据时可以按照数据原貌直接传输,但也可以在传输过程中通过编码提升传输速率。通过在传输时编码,可以有效地处理大量的访问请求。

报文和实体

报文
是HTTP通信的基本单位,由8位字节流组成,通过HTTP通信传输 实体
作为请求或响应的有效载荷数据(补充项)被传输,其内容由实体首部和实体主体组成。

HTTP报文的主体用于传输请求或响应的实体主体。
通常,报文主体等于实体主体。只有当传输中进行编码操作时,实体主体的内容发生变化,才导致它和报文主体产生差异。

内容编码

内容编码指明应用在实体内容上的编码格式,并保持实体信息原样压缩。服务器端内容编码后的实体由客户端接收并负责解码

常见的内容编码有以下几种:

gzip compress deflate identity

分块传输编码

在HTTP通信中,请求的编码实体资源尚未全部传输完成之前,浏览器无法显示请求页面。在传输大容量数据时,通过把数据分割成多块,能够让浏览器逐步显示页面。
这种把实体主体分块的功能称为分块传输编码

分块传输编码会将实体主体分成多个部分,每一部分都会用十六进制来标记块的大小。

使用分块传输编码的实体主体会由接受的客户端负责接吗,恢复编码前的实体主体。

多部分对象集合Multipart

在发送邮件时我们可以上传多种类型的附件,这是因为采用了MIME机制。而在MIME扩展中会使用一种称为多部分对象集合(Multipart)的方法,来容纳多份不同类型的数据。

相应地,HTTP协议中也采纳了多部分对象集合,发送的一份报文主体内可含有多类型实体。通常是在图片或文本文件等上传时使用。

多部分对象集合包含的对象如下:

multipart/form-data
在Web表单文件上传时使用 multipart/byteranges
状态码206相应报文包含多个范围的内容时使用(下一节会说到)

在HTTP报文中使用多部分对象集合时,需要在首部字段里加上Content-type。

范围请求

以前用户不能使用现在这种高度带宽访问互联网时,如果在下载一个大文件的时候网络中断那么就要从头开始。为了解决这种问题,需要一种可恢复的机制,也就是从之前下载中断处恢复下载。

要实现该功能需要指定下载的实体范围。像这样指定范围发送的请求叫做范围请求

执行范围请求时,会用到首部字段Range来指定资源的byte范围。

//5001~10000字节
Range:bytes=5001-10000

//从5001字节之后全部的
Range:bytes=5001-

//从一开始到3000字节和5000~7000字节的多重范围
Range:bytes=-3000,5000-7000

针对范围请求,响应会返回状态码为206 Partial Content 的响应报文。
另外,对于多重范围的范围请求,响应会在首部字段Content-type标明multipart/byterange后返回响应报文。

内容协商返回最合适的内容

同一个Web网站有可能存在着多份相同内容的页面。比如英文版和中文版的Web页面。

当浏览器的默认语言为英语或中文,访问相同URI的Web页面时会显示对应语言版本的Web页面。这种机制称为内容协商

内容协商是指客户端和服务器端就响应的资源内容进行交涉然后提供给客户端最为合适的资源。内容协商会以响应资源的语言、字符集、编码方式等作为判断的基准。

包含在请求报文中的某些首部字段就是判断的基准:

Accept Accept-Charset Accept-Encoding Accept-Language Content-Language

内容协商技术有以下3种类型:

服务器驱动协商
由服务器端进行内容协商。以请求的首部字段为参考,在服务器端自动处理。 客户端驱动协商
由客户端进行内容协商的方式。用户从浏览器显示的可选项列表中手动选择。 透明协商
是服务器驱动和客户端驱动的结合体,是由服务器端和客户端各自进行内容协商的一种方法。

Tags:HT TT TP P学 
作者:网络 来源:gigi奋斗