socket 是一种常用的进程间通信接口。
socket object
Python 实现 socket 的主体对象是 socket.socket
类。两个互相连接的 socket 对象之间是对等的,因此他们的连接过程基本上是这样的:
- 乙方首先监听一个端口,并将自己的 ip 和 port 通过其他方式告知甲方
- 甲方向该 (ip, port) 发起连接请求
- 乙方接受此请求,连接建立成功,双方可以通信
用代码来解释就是这样:
乙:
import socketsock = socket.socket()sock.bind(('127.0.0.1', 2333))sock.listen(1)conn, addr = sock.accept() # 这里可能会阻塞data = conn.recv(1024) # 同上
甲:
import socketsock = socket.socket()sock.connect(('127.0.0.1', 2333))sock.send(b'hello')
其中乙方的 .bind
方法就是先声明并占用一个通信端口,这样甲方才知道第一次的连接请求应该发送到哪。然后乙方调用 .listen
方法开始监听,当甲方的 connect
请求发送过来后,调用 accept
方法即可接受甲方的连接请求,此方法返回一个新的 socket 对象(conn
)和甲方的地址。
所以这里 type(conn) is type(sock)
是会返回 True
的,即当你调用一个已绑定的 socket 对象的 listen 方法时,他实际会调起一个服务器监听绑定的地址,并返回一个 新的 socket 对象用于通信,然后原 socket 对象继续监听,并在 accept 时继续创建新的 socket 对象。这里的甲乙 sock
对象是一种 C/S 模型。刚才说的对等模型其实是指 甲方的 sock
对象和乙方的 conn
对象。
因此这里的一个问题在于,乙方的 Server 在面对多个甲方的随机 connect 请求时,很可能没办法做到立即接受(.accept
),而又不可能让甲方一直等待。所以 listen
方法提供了一个整型的 backlog
参数,在上例中其为 1. 这个参数表示在 accept 之前最多可以积压多少个 connect 请求。实际上说是积压,其实是直接返回了确认接受的信息。即,如果上面代码中乙方先不调用 accept,甲方也是可以 send 的,b'hello' 会被缓冲起来。乙方再调用 accept 和 recv 依然可以拿到数据。而因为上面设置的 backlog 是 1,所以如果在乙方 accept 之前又有一个 socket 向乙方发起 connect 请求,他就会立即收到一个显式的(积极的)拒绝连接响应。
send & recv
socket 因为是语言无关的接口,所以只能用它发送字节码(二进制)。所以你需要 encode/decode
一下你的字符串对象。而数据流(socket.SOCK_STREAM
)又没有既定的边界。所以需要使用者自行管理边界问题。即甲方先后发送的两段数据,在乙方的缓冲中虽然有先后顺序,却没有间隔。
socketserver
socketserver 是 Python 标准库的一个包,功能如其名,是一个 socket 服务器开发框架。