2.1.3 HTTP和HTTPS · python3爬蟲筆記

# 2.1.3 HTTP和HTTPS HTTP 的全稱是 Hyper Text Transfer Protocol，中文名叫做超文本傳輸協議，HTTP 協議是用于從網絡傳輸超文本數據到本地瀏覽器的傳送協議，它能保證傳送高效而準確地傳送超文本文檔。 HTTPS 的全稱是 Hyper Text Transfer Protocol over Secure Socket Layer，是以安全為目標的 HTTP 通道，簡單講是 HTTP 的安全版，即 HTTP 下加入 SSL 層，簡稱為 HTTPS。 HTTPS 的安全基礎是 SSL，因此通過它傳輸的內容都是經過 SSL 加密的，它的主要作用可以分為兩種： * 是建立一個信息安全通道，來保證數據傳輸的安全。 * 確認網站的真實性，凡是使用了 https 的網站，都可以通過點擊瀏覽器地址欄的鎖頭標志來查看網站認證之后的真實信息，也可以通過 CA 機構頒發的安全簽章來查詢。而某些網站雖然使用了 HTTPS 協議還是會被瀏覽器提示不安全，所以這里證書驗證就不會通過而提示這樣的話，但是實際上它的數據傳輸依然是經過 SSL 加密的。我們如果要爬取這樣的站點就需要設置忽略證書的選項，否則會提示 SSL 鏈接錯誤。