http 1.1（2） · smart_jiaxiaoli

# ****HTTP協議之請求Request**** ## **一、請求的URL** ### 1、**什么是URL？** ***** URL是一種特殊類型的URI，包含了用于查找某個資源的足夠的信息 URL,全稱是UniformResourceLocator, 中文叫統一資源定位符,是互聯網上用來標識某一處資源的地址。 ***** ### **2、以下面這個URL為例，介紹下普通URL的各部分組成：** ***** http://www.aspxfans.com:8080/news/index.asp?boardID=5&ID=24618&page=1#name 一個完整的URL包括以下幾部分： A.**協議部分**：http://該URL的協議部分為“http：”，在"HTTP"后面的“//”為分隔符。這代表網頁使用的是HTTP協議。在Internet中可以使用多種協議，如HTTP，FTP等等。===>如果不寫，瀏覽器會自動補全，但必須有 B.**域名部分**：www.aspxfans.com一個URL中，也可以使用IP地址作為域名使用===>必須有 C.**端口部分**：8080跟在域名后面的是端口，域名和端口之間使用“:”作為分隔符。===>端口不是一個URL必須的部分，如果省略端口部分，將采用默認端口80 D.**虛擬目錄部分**：/news/從域名后的第一個“/”開始到最后一個“/”為止，是虛擬目錄部分。===>虛擬目錄也不是一個URL必須的部分。 E.**文件名部分**：index.asp從域名后的最后一個“/”開始到“？”為止，是文件名部分，如果沒有“?”,則是從域名后的最后一個“/”開始到“#”為止，是文件部分，如果沒有“？”和“#”，那么從域名后的最后一個“/”開始到結束，都是文件名部分。===>文件名部分也不是一個URL必須的部分，如果省略該部分，則使用默認的文件名 F.**參數部分**：boardID=5&ID=24618&page=1從“？”開始到“#”為止之間的部分為參數部分，又稱搜索部分、查詢部分。參數可以允許有多個參數，參數與參數之間用“&”作為分隔符。===>參數部分非必須 G.**錨部分**：#name從“#”開始到最后，都是錨部分。===>錨部分也不是一個URL必須的部分 ***** ### **3、URL與URI，URN有什么區別？** ***** * 1、URI，是uniform resource identifier，統一資源標識符，用來唯一的標識一個資源。Web上可用的每種資源如HTML文檔、圖像、視頻片段、程序等都是一個來URI來定位的 URI一般由三部組成： ①訪問資源的命名機制 ②存放資源的主機名 ③資源自身的名稱，由路徑表示，著重強調于資源。 * 2、URL是uniform resource locator，統一資源定位器，它是一種具體的URI，即URL可以用來標識一個資源，而且還指明了如何locate這個資源。URL是Internet上用來描述信息資源的字符串，主要用在各種WWW客戶程序和服務器程序上，特別是著名的Mosaic。采用URL可以用一種統一的格式來描述各種信息資源，包括文件、服務器的地址和目錄等。URL一般由三部組成： ①協議(或稱為服務方式) ②存有該資源的主機IP地址(有時也包括端口號) ③主機資源的具體地址。如目錄和文件名等 * 3、URN，uniform resource name，統一資源命名，是通過名字來標識資源，比如mailto:java-net@java.sun.com。URI是以一種抽象的，高層次概念定義統一資源標識，而URL和URN則是具體的資源標識的方式。URL和URN都是一種URI。籠統地說，每個 URL 都是 URI，但不一定每個 URI 都是 URL。這是因為 URI 還包括一個子類，即統一資源名稱 (URN)，它命名資源但不指定如何定位資源。上面的 mailto、news 和 isbn URI 都是 URN 的示例。在Java的URI中，一個URI實例可以代表絕對的，也可以是相對的，只要它符合URI的語法規則。而URL類則不僅符合語義，還包含了定位該資源的信息，因此它不能是相對的。在Java類庫中，URI類不包含任何訪問資源的方法，它唯一的作用就是解析。相反的是，URL類可以打開一個到達資源的流。 * ***他們三個的區別有點像是CSS的屬性選擇器，應該說都是做定位篩選用的，一個是在網頁中定位，一個是在全球范圍內的資源定位*** ***** ## **二、Request請求的格式** 客戶端發送一個HTTP請求到服務器的請求消息格式為：**請求行**（request line）、**請求頭部**（header）、**空行**和**請求數據**四個部分組成 :-: ![](https://box.kancloud.cn/ff5d37e40e0dca70d7e3e6c0dcdca1d0_466x165.png) * 1、Http協議定義了很多與服務器交互的方法（了解）HTTP1.0定義了三種請求方法： GET, POST 和 HEAD方法。 HTTP1.1新增了五種請求方法：OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。 * 2、了解下各個方法的大致意義 GET 請求指定的頁面信息，并返回實體主體。 HEAD 類似于get請求，只不過返回的響應中沒有具體的內容，用于獲取報頭 POST 向指定資源提交數據進行處理請求（例如提交表單或者上傳文件）。數據被包含在請求體中。POST請求可能會導致新的資源的建立和/或已有資源的修改。 PUT 從客戶端向服務器傳送的數據取代指定的文檔的內容。 DELETE 請求服務器刪除指定的頁面。 CONNECT HTTP/1.1協議中預留給能夠將連接改為管道方式的代理服務器。 OPTIONS 允許客戶端查看服務器的性能。 TRACE 回顯服務器收到的請求，主要用于測試或診斷。 * 3、一個URL地址用于描述一個網絡上的資源，而HTTP中最基本的四個方法GET, POST, PUT, DELETE就對應著對這個資源的查，改，增，刪4個操作。 * 4、我們最常見的就是GET和POST了。GET一般用于獲取/查詢資源信息，而POST一般用于更新資源信息. ***** #### ***GET請求與POST請求的區別*** ***** 簡單的說法就是get請求會在url上體現出來，而post不會，當然這只是表面上的 * 1、參數的組織方式不同GET提交的數據會放在URL之后，以?分割URL和傳輸數據，參數之間以&相連，例如：login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0 %E5%A5%BD。如果數據是英文字母/數字，原樣發送，如果是空格，轉換為+，如果是中文/其他字符，則直接把字符串用BASE64加密，得出如： %E4%BD%A0%E5%A5%BD，其中％XX中的XX為該符號以16進制表示的ASCII。 POST方法是把提交的數據放在HTTP包的Body中. 因此，GET提交的數據會在地址欄中顯示出來，而POST提交，地址欄不會改變 * 2、傳輸數據大小限制首先聲明：HTTP協議沒有對傳輸的數據大小進行限制，HTTP協議規范也沒有對URL長度進行限制。而在實際開發中存在的限制主要有： GET:特定瀏覽器和服務器對URL長度有限制，例如 IE對URL長度的限制是2083字節(2K+35)。對于其他瀏覽器，如Netscape、FireFox等，理論上沒有長度限制，其限制取決于操作系統的支持。因此對于GET提交時，傳輸數據就會受到URL長度的限制。 POST:由于不是通過URL傳值，理論上數據不受限。但實際各個WEB服務器會規定對post提交數據大小進行限制，Apache、IIS6都有各自的配置。可以簡單總結為： GET提交的數據大小有限制（因為瀏覽器對URL的長度有限制），而POST方法提交的數據沒有限制. GET方式需要使用Request.QueryString來取得變量的值，而POST方式通過Request.Form來獲取變量的值。 * 3、安全性POST的安全性要比GET的安全性高。比如：通過GET提交數據，用戶名和密碼將明文出現在URL上，因為(1登錄頁面有可能被瀏覽器緩存；(2)其他人查看瀏覽器的歷史紀錄，那么別人就可以拿到你的賬號和密碼了，除此之外，使用GET提交數據還可能會造成Cross-site request forgery攻擊 ***** ## **三、**HTTP協議之響應Response**** 服務器接收并處理客戶端發過來的請求后會返回一個HTTP的響應消息Response HTTP響應也由四個部分組成，分別是：**狀態行**、**消息報頭**、**空行**和**響應正文**。 ![](https://img.kancloud.cn/5f/f8/5ff83835ca91d8334f31af8e1d95d6b5_683x305.png) * 第一部分：狀態行，由HTTP協議版本號，狀態碼，狀態消息三部分組成。第一行為狀態行，（HTTP/1.1）表明HTTP版本為1.1版本，狀態碼為200，狀態消息為（ok） * 第二部分：消息報頭，用來說明客戶端要使用的一些附加信息，Date:生成響應的日期和時間； Content-Type:指定了MIME類型的HTML(text/html),編碼類型是UTF-8 * 第三部分：空行，消息報頭后面的空行是必須的 * 第四部分：響應正文，服務器返回給客戶端的文本信息。空行后面的html部分為響應正文，瀏覽器就是會把這部分內容渲染到用戶的客戶端瀏覽器，就會產生網頁的效果了 ***** 狀態代碼有三位數字組成，第一個數字定義了響應的類別，共分五種類別: 1xx：指示信息--表示請求已接收，繼續處理 2xx：成功--表示請求已被成功接收、理解、接受 3xx：重定向--要完成請求必須進行更進一步的操作 4xx：客戶端錯誤--請求有語法錯誤或請求無法實現 5xx：服務器端錯誤--服務器未能實現合法的請求 **常見狀態碼**： 200 OK //客戶端請求成功 400 Bad Request //客戶端請求有語法錯誤，不能被服務器所理解401 Unauthorized //請求未經授權，這個狀態代碼必須和WWW-Authenticate報頭域一起使用 403 Forbidden //服務器收到請求，但是拒絕提供服務 404 Not Found //請求資源不存在，eg：輸入了錯誤的URL 500 Internal Server Error //服務器發生不可預期的錯誤 503 Server Unavailable //服務器當前不能處理客戶端的請求，一段時間后可能恢復正常 ***** ## ****四、HTTP協議完整工作流程**** HTTP協議定義Web客戶端如何從Web服務器請求Web頁面，以及服務器如何把Web頁面傳送給客戶端。HTTP協議采用了請求/響應模型。客戶端向服務器發送一個請求報文，請求報文包含請求的方法、URL、協議版本、請求頭部和請求數據。服務器以一個狀態行作為響應，響應的內容包括協議的版本、成功或者錯誤代碼、服務器信息、響應頭部和響應數據。以下是 HTTP 請求/響應的步驟： **1、客戶端連接到Web服務器** 一個HTTP客戶端，通常是瀏覽器，與Web服務器的HTTP端口（默認為80）建立一個TCP套接字連接。例如，http://www.oakcms.cn。 **2、發送HTTP請求** 通過TCP套接字，客戶端向Web服務器發送一個文本的請求報文，一個請求報文由請求行、請求頭部、空行和請求數據4部分組成。 **3、服務器接受請求并返回HTTP響應** Web服務器解析請求，定位請求資源。服務器將資源復本寫到TCP套接字，由客戶端讀取。一個響應由狀態行、響應頭部、空行和響應數據4部分組成。 **4、釋放連接TCP連接** 若connection 模式為close，則服務器主動關閉TCP連接，客戶端被動關閉連接，釋放TCP連接;若connection 模式為keepalive，則該連接會保持一段時間，在該時間內可以繼續接收請求; **5、客戶端瀏覽器解析HTML內容** 客戶端瀏覽器首先解析狀態行，查看表明請求是否成功的狀態代碼。然后解析每一個響應頭，響應頭告知以下為若干字節的HTML文檔和文檔的字符集。客戶端瀏覽器讀取響應數據HTML，根據HTML的語法對其進行格式化，并在瀏覽器窗口中顯示。 ## ****五、 HTTP協議的一些總結**** 1. 簡單快速客戶向服務器請求服務時，只需傳送請求方法和路徑。請求方法常用的有GET、HEAD、POST。每種方法規定了客戶與服務器聯系的類型不同。由于HTTP協議簡單，使得HTTP服務器的程序規模小，因而通信速度很快。 1. 靈活 HTTP允許傳輸任意類型的數據對象。正在傳輸的類型由Content-Type加以標記。 1. 無連接 HTTP無連接說的是：當某個客戶機在短時間多次次請求同一個資源，服務器并不能區別是否已經響應過用戶的請求。于是我們每次發送http請求，都需要事先發起一個到服務器的TCP請求，經歷“三次握手”的過程。這針對大流量的的服務器來說，開銷是相當大的。這是http無鏈接帶來的缺點針對http無連接，人們設計了非持久連接和持久連接。實際上關于http協議非持久連接和持久連接是針對tcp協議的。當客戶機/服務器的交互運行于TCP協議上時，應用程序的每個請求/響應對是經不同的TCP連接時，則該應用程序使用非持久連接，而當應用程序的每個請求/響應對是經相同的TCP連接發送，則該應用程序使用持久連接。 **非持久連接** 請求一個HTTP請求/響應需要的總時間=客戶端發出建立連接+發生請求報文+服務器傳輸HTML文件的時間 **持久連接** 服務器在發送響應后，保持該TCP連接打開。在相同的客戶機與服務器之間的后續請求和響應報文通過相同的連接進行傳送。不需要再次建立tcp連接 1. 無狀態所謂http是無狀態協議，言外之意是說http協議沒法保存客戶機信息， **無狀態的優點是：** 在服務器不需要先前信息時它的應答就較快。 **無狀態的缺點是：** 缺少狀態意味著如果后續處理需要前面的信息，則它必須重傳。這樣可能導致每次連接傳送的數據量增大關于http無狀態阻礙了交互式應用程序的實現。比如記錄用戶瀏覽哪些網頁、判斷用戶是否擁有權限訪問等。于是，兩種用于保持HTTP狀態的技術就應運而生了，一個是Cookie，而另一個則是Session。