Socket是網絡編程的一個抽象概念。通常我們用一個Socket表示“打開了一個網絡鏈接”,而打開一個Socket需要知道目標計算機的IP地址和端口號,再指定協議類型即可。
### 客戶端
大多數連接都是可靠的TCP連接。創建TCP連接時,主動發起連接的叫客戶端,被動響應連接的叫服務器。
舉個例子,當我們在瀏覽器中訪問新浪時,我們自己的計算機就是客戶端,瀏覽器會主動向新浪的服務器發起連接。如果一切順利,新浪的服務器接受了我們的連接,一個TCP連接就建立起來的,后面的通信就是發送網頁內容了。
所以,我們要創建一個基于TCP連接的Socket,可以這樣做:
~~~
# 導入socket庫:
import socket
# 創建一個socket:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立連接:
s.connect(('www.sina.com.cn', 80))
~~~
創建`Socket`時,`AF_INET`指定使用IPv4協議,如果要用更先進的IPv6,就指定為`AF_INET6`。`SOCK_STREAM`指定使用面向流的TCP協議,這樣,一個`Socket`對象就創建成功,但是還沒有建立連接。
客戶端要主動發起TCP連接,必須知道服務器的IP地址和端口號。新浪網站的IP地址可以用域名`www.sina.com.cn`自動轉換到IP地址,但是怎么知道新浪服務器的端口號呢?
答案是作為服務器,提供什么樣的服務,端口號就必須固定下來。由于我們想要訪問網頁,因此新浪提供網頁服務的服務器必須把端口號固定在`80`端口,因為`80`端口是Web服務的標準端口。其他服務都有對應的標準端口號,例如SMTP服務是`25`端口,FTP服務是`21`端口,等等。端口號小于1024的是Internet標準服務的端口,端口號大于1024的,可以任意使用。
因此,我們連接新浪服務器的代碼如下:
~~~
s.connect(('www.sina.com.cn', 80))
~~~
注意參數是一個`tuple`,包含地址和端口號。
建立TCP連接后,我們就可以向新浪服務器發送請求,要求返回首頁的內容:
~~~
# 發送數據:
s.send(b'GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')
~~~
TCP連接創建的是雙向通道,雙方都可以同時給對方發數據。但是誰先發誰后發,怎么協調,要根據具體的協議來決定。例如,HTTP協議規定客戶端必須先發請求給服務器,服務器收到后才發數據給客戶端。
發送的文本格式必須符合HTTP標準,如果格式沒問題,接下來就可以接收新浪服務器返回的數據了:
~~~
# 接收數據:
buffer = []
while True:
# 每次最多接收1k字節:
d = s.recv(1024)
if d:
buffer.append(d)
else:
break
data = b''.join(buffer)
~~~
接收數據時,調用`recv(max)`方法,一次最多接收指定的字節數,因此,在一個while循環中反復接收,直到`recv()`返回空數據,表示接收完畢,退出循環。
當我們接收完數據后,調用`close()`方法關閉Socket,這樣,一次完整的網絡通信就結束了:
~~~
# 關閉連接:
s.close()
~~~
接收到的數據包括HTTP頭和網頁本身,我們只需要把HTTP頭和網頁分離一下,把HTTP頭打印出來,網頁內容保存到文件:
~~~
header, html = data.split(b'\r\n\r\n', 1)
print(header.decode('utf-8'))
# 把接收的數據寫入文件:
with open('sina.html', 'wb') as f:
f.write(html)
~~~
現在,只需要在瀏覽器中打開這個`sina.html`文件,就可以看到新浪的首頁了。
### 服務器
和客戶端編程相比,服務器編程就要復雜一些。
服務器進程首先要綁定一個端口并監聽來自其他客戶端的連接。如果某個客戶端連接過來了,服務器就與該客戶端建立Socket連接,隨后的通信就靠這個Socket連接了。
所以,服務器會打開固定端口(比如80)監聽,每來一個客戶端連接,就創建該Socket連接。由于服務器會有大量來自客戶端的連接,所以,服務器要能夠區分一個Socket連接是和哪個客戶端綁定的。一個Socket依賴4項:服務器地址、服務器端口、客戶端地址、客戶端端口來唯一確定一個Socket。
但是服務器還需要同時響應多個客戶端的請求,所以,每個連接都需要一個新的進程或者新的線程來處理,否則,服務器一次就只能服務一個客戶端了。
我們來編寫一個簡單的服務器程序,它接收客戶端連接,把客戶端發過來的字符串加上`Hello`再發回去。
首先,創建一個基于IPv4和TCP協議的Socket:
~~~
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
~~~
然后,我們要綁定監聽的地址和端口。服務器可能有多塊網卡,可以綁定到某一塊網卡的IP地址上,也可以用`0.0.0.0`綁定到所有的網絡地址,還可以用`127.0.0.1`綁定到本機地址。`127.0.0.1`是一個特殊的IP地址,表示本機地址,如果綁定到這個地址,客戶端必須同時在本機運行才能連接,也就是說,外部的計算機無法連接進來。
端口號需要預先指定。因為我們寫的這個服務不是標準服務,所以用`9999`這個端口號。請注意,小于`1024`的端口號必須要有管理員權限才能綁定:
~~~
# 監聽端口:
s.bind(('127.0.0.1', 9999))
~~~
緊接著,調用`listen()`方法開始監聽端口,傳入的參數指定等待連接的最大數量:
~~~
s.listen(5)
print('Waiting for connection...')
~~~
接下來,服務器程序通過一個永久循環來接受來自客戶端的連接,`accept()`會等待并返回一個客戶端的連接:
~~~
while True:
# 接受一個新連接:
sock, addr = s.accept()
# 創建新線程來處理TCP連接:
t = threading.Thread(target=tcplink, args=(sock, addr))
t.start()
~~~
每個連接都必須創建新線程(或進程)來處理,否則,單線程在處理連接的過程中,無法接受其他客戶端的連接:
~~~
def tcplink(sock, addr):
print('Accept new connection from %s:%s...' % addr)
sock.send(b'Welcome!')
while True:
data = sock.recv(1024)
time.sleep(1)
if not data or data.decode('utf-8') == 'exit':
break
sock.send(('Hello, %s!' % data).encode('utf-8'))
sock.close()
print('Connection from %s:%s closed.' % addr)
~~~
連接建立后,服務器首先發一條歡迎消息,然后等待客戶端數據,并加上`Hello`再發送給客戶端。如果客戶端發送了`exit`字符串,就直接關閉連接。
要測試這個服務器程序,我們還需要編寫一個客戶端程序:
~~~
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立連接:
s.connect(('127.0.0.1', 9999))
# 接收歡迎消息:
print(s.recv(1024).decode('utf-8'))
for data in [b'Michael', b'Tracy', b'Sarah']:
# 發送數據:
s.send(data)
print(s.recv(1024).decode('utf-8'))
s.send(b'exit')
s.close()
~~~
我們需要打開兩個命令行窗口,一個運行服務器程序,另一個運行客戶端程序,就可以看到效果了:

需要注意的是,客戶端程序運行完畢就退出了,而服務器程序會永遠運行下去,必須按Ctrl+C退出程序。
### 小結
用TCP協議進行Socket編程在Python中十分簡單,對于客戶端,要主動連接服務器的IP和指定端口,對于服務器,要首先監聽指定端口,然后,對每一個新的連接,創建一個線程或進程來處理。通常,服務器程序會無限運行下去。
同一個端口,被一個Socket綁定了以后,就不能被別的Socket綁定了。
### 參考源碼
[do_tcp.py](https://github.com/michaelliao/learn-python3/blob/master/samples/socket/do_tcp.py)
- 關于
- Python簡介
- 安裝Python
- Python解釋器
- 第一個Python程序
- 使用文本編輯器
- Python代碼運行助手
- 輸入和輸出
- Python基礎
- 數據類型和變量
- 字符串和編碼
- 使用list和tuple
- 條件判斷
- 循環
- 使用dict和set
- 函數
- 調用函數
- 定義函數
- 函數的參數
- 遞歸函數
- 高級特性
- 切片
- 迭代
- 列表生成式
- 生成器
- 迭代器
- 函數式編程
- 高階函數
- 返回函數
- 匿名函數
- 裝飾器
- 偏函數
- 模塊
- 使用模塊
- 安裝第三方模塊
- 面向對象編程
- 類和實例
- 訪問限制
- 繼承和多態
- 獲取對象信息
- 實例屬性和類屬性
- 面向對象高級編程
- 使用slots
- 使用@property
- 多重繼承
- 定制類
- 使用枚舉類
- 使用元類
- 錯誤、調試和測試
- 錯誤處理
- 調試
- 單元測試
- 文檔測試
- IO編程
- 文件讀寫
- StringIO和BytesIO
- 操作文件和目錄
- 序列化
- 進程和線程
- 多進程
- 多線程
- ThreadLocal
- 進程 vs. 線程
- 分布式進程
- 正則表達式
- 常用內建模塊
- datetime
- collections
- base64
- struct
- hashlib
- itertools
- XML
- HTMLParser
- urllib
- 常用第三方模塊
- PIL
- virtualenv
- 圖形界面
- 網絡編程
- TCP/IP簡介
- TCP編程
- UDP編程
- 電子郵件
- SMTP發送郵件
- POP3收取郵件
- 訪問數據庫
- 使用SQLite
- 使用MySQL
- 使用SQLAlchemy
- Web開發
- HTTP協議簡介
- HTML簡介
- WSGI接口
- 使用Web框架
- 使用模板
- 異步IO
- 協程
- asyncio
- aiohttp
- 實戰
- Day 1 - 搭建開發環境
- Day 2 - 編寫Web App骨架
- Day 3 - 編寫ORM
- Day 4 - 編寫Model
- Day 5 - 編寫Web框架
- Day 6 - 編寫配置文件
- Day 7 - 編寫MVC
- Day 8 - 構建前端
- Day 9 - 編寫API
- Day 10 - 用戶注冊和登錄
- Day 11 - 編寫日志創建頁
- Day 12 - 編寫日志列表頁
- Day 13 - 提升開發效率
- Day 14 - 完成Web App
- Day 15 - 部署Web App
- Day 16 - 編寫移動App
- FAQ
- 期末總結