使用代理 · Python爬蟲

**1. 去代理網站上尋找ip代理** 芝麻HTTP代理：http://www.zhimahttp.com/?utm-source=bdtg&utm-keyword=?DL200981 快代理：https://www.kuaidaili.com/free/ 米撲代理：https://proxy.mimvp.com/freesecret <br/> **2. 在代碼中使用** ```python # 1. 創建代理字典 proxies = { 'http': 'http://12.34.56.79:9257', # 協議:協議://ip:端口 'https':'114.99.199.39:8080' # 也可以寫成協議:ip:端口 } headers={'User-Agent', 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36' } # 2. 提供了多個ip代理，如果前一個ip代理不可用，則會切換到下一個 response = requests.get('http://www.baidu.com', proxies = proxies, headers=headers) print(r.status_code) ``` <br/> 我們可以事先準備一堆的IP地址，組成IP池，每次隨機從中選擇一個IP來用。 IP要保證是有效的，可以使用如下兩個方案來檢測每一個IP的有效性： 1. 使用`requests`檢查； ```python requests.get(url, proxies=proxies, timeout=10) # 無效的代理存在兩種情況 # 1. 如果設置了timeout超時時間，則無效的代理超時后轉切換到下一個ip進行嘗試； # 2. 拋出異常； ``` 2. 使用在線代理IP質量檢查網站，如 http://h.jiguangdaili.com/check/