0

我正在学习套接字编程并尝试设计我的基本 http 客户端。但不知何故,一切都很顺利,但我没有收到任何数据。你能告诉我我错过了什么吗?

代码

import socket

def create_socket():
    return socket.socket( socket.AF_INET, socket.SOCK_STREAM )

def remove_socket(sock):
    sock.close()
    del sock


sock = create_socket()
print "Connecting"
sock.connect( ('en.wikipedia.org', 80) )
print "Sending Request"
print sock.sendall  ('''GET /wiki/List_of_HTTP_header_fields HTTP/1.1
Host: en.wikipedia.org
Connection: close
User-Agent: Web-sniffer/1.0.37 (+http://web-sniffer.net/)
Accept-Encoding: gzip
Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7
Cache-Control: no-cache
Accept-Language: de,en;q=0.7,en-us;q=0.3
Referer: d_r_G_o_s
''')
print "Receving Reponse"
while True:
    content = sock.recv(1024)
    if content:
        print content
    else:
        break
print "Completed"

输出

Connecting
Sending Request
298
Receving Reponse
Completed

虽然我期待它向我展示维基百科主页的 html 内容:'(

此外,如果有人可以分享一些网络资源/书籍,我可以在其中详细阅读有关 HTTP 请求客户端的 python 套接字编程的详细信息,那就太好了

谢谢!

4

1 回答 1

3

对于最小的 HTTP 客户端,您绝对不应该发送Accept-Encoding: gzip- 服务器很可能会回复一个您无法用肉眼理解的压缩响应。:)

您没有发送最后的双精度\r\n(也不是您实际上\r\n按照规范终止了您的行(除非您碰巧在 Windows 上使用 Windows 行结尾进行开发,但这只是运气而不是编程本身)。

此外,del sock没有做你认为它做的事情。

无论如何 - 这有效:

import socket
sock = socket.socket()
sock.connect(('en.wikipedia.org', 80))
for line in (
    "GET /wiki/List_of_HTTP_header_fields HTTP/1.1",
    "Host: en.wikipedia.org",
    "Connection: close",
):
    sock.send(line + "\r\n")
sock.send("\r\n")

while True:
    content = sock.recv(1024)
    if content:
        print content
    else:
        break

编辑:至于资源/书籍/参考——对于参考 HTTP 客户端实现,请查看 Python 自己的httplib.py. :)

于 2012-04-10T07:14:21.897 回答