我想使用 Urlretrieve 从页面下载 txt 文件。然而,它有时运行良好,但大多数时候只是下载了不可读的文本。
以下是我的代码和网站:
import urllib
import os,sys
opener = urllib.request.build_opener()
opener.addheaders = [('User-Agent','Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36')]
urllib.request.install_opener(opener)
url='http://www.17500.cn/getData/ssq.TXT'
try:
urllib.request.urlretrieve(url, os.getcwd()+'/data/data - all.txt')
except urllib.error.HTTPError as e:
print('failure')
但是,如果我打开数据 - all.tex,我会得到?Y?K?堽??R逆a{PU类,憕7>翰*嬊荪傛0@?瑫襅?威J鸰?迭惊W踎?m?邒?纯? я?锖束+鳢^祸读?茔?頬</p>