Java web客户端和服务器端交互的原理

时间：2020-10-06 09:56:31 J2EE培训我要投稿

　　其实HTTP客户端和服务器端的交互原理很简单：即先是浏览器和服务器端建立Socket无状态连接，也就是短连接，然后通过IO流进行报文信息(这个报文是严格遵循HTTP报文接口的)的交互，最后会话结束后就关闭连接。对于这些底层的协议和报文的打包解包交互的实现，其实java和浏览器早都已经封装好了，程序员只要专注于业务逻辑的实现就行。

Java web客户端和服务器端交互的原理

　　1. 协议

　　a. TCP/IP整体构架概述

　　TCP/IP协议并不完全符合OSI的七层参考模型。传统的开放式系统互连参考模型，是一种通信协议的7层抽象的参考模型,其中每一层执行某一特定任务。该模型的目的是使各种硬件在相同的层次上相互通信。这7层是:物理层、数据链路层、网路层、传输层、话路层、表示层和应用层。而TCP/IP通讯协议采用了4层的层级结构，每一层都呼叫它的下一层所提供的网络来完成自己的需求。这4层分别为：

　　i. 应用层：应用程序间沟通的层，如超文本传送协议(HTTP)、简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等。

　　ii. 传输层：在此层中，它提供了节点间的数据传送服务，如传输控制协议(TCP)、用户数据报协议(UDP)等，TCP和UDP给数据包加入传输数据并把它传输到下一层中，这一层负责传送数据，并且确定数据已被送达并接收。

　　iii. 互连网络层：负责提供基本的数据封包传送功能，让每一块数据包都能够到达目的主机(但不检查是否被正确接收)，如网际协议(IP)。

　　iv. 网络接口层：对实际的网络媒体的管理，定义如何使用实际网络(如Ethernet、Serial Line等)来传送数据。

　　b. HTTP协议介绍：

　　i. HTTP是一种超文本传送协议(HyperText Transfer Protocol),是一套计算机在网络中通信的一种规则。在TCP/IP体系结构中，HTTP属于应用层协议，位于TCP/IP协议的顶层

　　ii. HTTP是一种无状态的的协议，意思是指在Web 浏览器(客户端)和 Web 服务器之间不需要建立持久的连接。整个过程就是当一个客户端向服务器端发送一个请求(request)，然后Web服务器返回一个响应 (response),之后连接就关闭了，在服务端此时是没有保留连接的信息。

　　iii. HTTP 遵循请求/响应(request/response) 模型的，所有的通信交互都被构造在一套请求和响应模型中。

　　iv. 浏览WEB时，浏览器通过HTTP协议与WEB服务器交换信息，Web服务器向Web浏览器返回的文件都有与之相关的类型,这些信息类型的格式由MIME定义。

　　c. 协议的java实现方式

　　不论是TCP/IP协议也好，还是HTTP协议也好，java都是通过套接字(java.net.Socket)来实现的，可以参考我的另一篇技术博客：一个项目看java TCP/IP Socket编程(1.3版)

　　2. HTTP报文接口及客户端和服务器端交互原理

　　a. HTTP定义的事务处理由以下四步组成：

　　i. 建立连接：

　　例如我在浏览器里输入 http://cuishen.iteye.com，客户端请求这个地址时即打开了web服务器HTTP端口的一个套接字。因为在网络中间作为传递数据的实体介质就是网线，数据实质上是通过IO流进行输出和输入，这就不难理解我们为什么在写一个Servlet的时候要引用 import java.io.*; 的原因，包括我们在向客户端回发结果的时候要用到PrintWriter对象的println()方法。其实请求的这个地址还要加上端口号80，80可以不写，是因为浏览器默认的端口号是80。

　　在Java底层代码中是这样实现的，只不过它们已经帮我们做了。

　　Socket socket = new Socket("cuishen.iteye.com",80);

　　InputStream in = socket.getInputStream();

　　OutputStream out = socket.getOutputStream();

　　ii. 客户端发送HTTP请求报文(request)

　　一旦建立了TCP连接，Web浏览器就会向Web服务器发送请求命令,是一个ASCII文本请求行，后跟0个或多个HTTP头标，一个空行和实现请求的任意数据。

　　即报文分四个部分：请求行，请求头标，空行和请求数据

　　1)请求行

　　请求行由三个标记组成：请求方法、请求URL和HTTP版本，中间用空格分开

　　例如： GET cuishen.iteye.com/blog/242842 HTTP/1.1

　　HTTP规范定义了8种可能的请求方法：(最常见的就是 GET 和 POST 两种方法)

　　GET -- 检索URI中标识资源的一个简单请求

　　HEAD -- 与GET方法相同，服务器只返回状态行和头标，并不返回请求文档

　　POST -- 服务器接受被写入客户端输出流中的数据的请求

　　PUT -- 服务器保存请求数据作为指定URI新内容的请求

　　DELETE -- 服务器删除URI中命名的资源的请求

　　OPTIONS -- 关于服务器支持的请求方法信息的请求

　　TRACE -- Web服务器反馈Http请求和其头标的请求

　　CONNECT -- 已文档化但当前未实现的一个方法，预留做隧道处理

　　2)请求头标

　　请求头标：由key ：value 健值组成，每行一对。请求头标用来通知服务器有关客户端的功能和标识。

　　HOST -- 请求的哪一个服务器端地址，主地址，比如：我的.技术blog：cuishen.iteye.com

　　User-Agent -- 用户即客户端可以使用的浏览器，如： Mozilla/4.0

　　Accept -- 即客户端可以接受的MIME 类型列表，如image/gif、text/html、application/msword

　　Content-Length -- 只适用于POST请求，以字节给出POST数据的尺寸

　　3)空行

　　发送回车符和退行，通知服务器以下不再有头标。

　　4)请求数据

　　使用POST传送数据，最常使用的是Content-Type和Content-Length头标。

　　请求报文总结：

　　我们可以这样写出一个标准的 HTTP请求：

　　POST /blog/242842 HTTP1.1

　　HOST: cuishen.iteye.com/

　　User-Agent: Mozilla/4.0

　　Accpt: image/gif,text/html,application/pdf,image/png...

　　key=value&key=value&key=value...... (POST()请求的数据)

　　这上面的一个例子意思是：

　　我要去访问的服务器端的地址是cuishen.iteye.com/ 它下面的资源 /blog/242842

　　连起来就是： cuishen.iteye.com/blog/242842

　　这个页面用的是 HTTP1.1 规范，我的浏览器版本是Mozilla/4.0

　　可以支持的MIME格式为 image/gif,text/html,application/pdf,image/png...等等

　　这个MIME格式我们在servlet中写法是：response.setContentType("text/html;charset=gb2312");

　　或者在jsp中写法是：

　　或者在html中写法是：

　　GET 和 POST 最直观的区别就是：GET方法将数据的请求跟在了所请求的URL后面，也就是在请求行里面我们是这么样来做的：

　　GET /blog/242842?key=value&key=value&key=value......HTTP1.1

　　实际上用 GET 是这样传递数据的：

　　http://cuishen.iteye.com/?page=2......

　　iii.服务器端响应请求生成结果并回发(response)

　　Web 服务器解析请求，定位指定的资源 http://cuishen.iteye.com/blog/242842

　　1)根据请求时的 GET/POST 对应的用servlet里的 doGet() / doPost()方法来处理(有可能是一些业务逻辑，也有可能是一些验证等等，也有可能是一些数据查询，提交等等)其有效的数据就来源于key=value&key=value&key=value......，以及其它的一些封装在 request 对象中的数据资源。

　　2)处理请求之后，由 response 对象得到 java.io.PrintWriter 输出流对象out，通过 out.println(); 将数据以指定的格式，如按照response.setcontentType("text/html;charset=gb2312");的格式输出到输出流。

　　它的响应报文与请求报文非常类似，其区别就在于：我们在请求阶段的请求行被状态行给替换了，再来看响应报文：

　　3)一个响应报文由四个部分组成：状态行、响应头标、空行、响应数据：

　　(a).状态行：

　　状态行由三个标记组成：HTTP版本、响应代码和响应描述。

　　HTTP1.1 --- 100 --- continue //继续追加后继内容

　　HTTP1.1 --- 200 --- OK //一切正常

　　HTTP1.1 --- 301 --- Moved Permanently //请求的文档在其它地方，会自动连接

　　HTTP1.1 --- 403 --- Forbidden //绝对拒绝你访问这个资源，不管授权没有

　　HTTP1.1 --- 400 --- Bad Request //客户端请求中的不良语法

　　HTTP1.1 --- 404 --- Not Found //最常见，绝对是大名鼎鼎的找不到

　　HTTP响应码：