python - Urlretrieve 下载的不可读文本

问问题 2018-04-04T00:54:37.177

106 次

我想使用 Urlretrieve 从页面下载 txt 文件。然而，它有时运行良好，但大多数时候只是下载了不可读的文本。

以下是我的代码和网站：

import urllib
import os,sys


opener = urllib.request.build_opener() 
opener.addheaders = [('User-Agent','Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36')] 
urllib.request.install_opener(opener) 
url='http://www.17500.cn/getData/ssq.TXT'
try: 
    urllib.request.urlretrieve(url, os.getcwd()+'/data/data - all.txt') 
except urllib.error.HTTPError as e: 
    print('failure')

但是，如果我打开数据 - all.tex，我会得到？Y?K?堽??R逆a{PU类,憕7>翰*嬊荪傛0@?瑫襅?威J鸰?迭惊W踎?m?邒?纯? я?锖束+鳢^祸读?茔?頬</p>

python - Urlretrieve 下载的不可读文本

0 回答 0

Related

Reference