file_txt = urllib.request.urlopen("ftp://ftp.sec.gov/edgar/data/1220985/0000930413-12-003922.txt")
file = file_txt.read().decode('cp1252')
soup = BeautifulSoup(file)
print(soup.prettify())
#UnicodeEncodeError: 'charmap' codec can't encode character '\x92' in position 11900: character maps to <undefined>
我检查了txt文件。当它显示在浏览器中时,\x92
实际上显示’
为'
. 我不确定为什么在使用与cp1252
浏览器相同的编码方案 ( ) 对其进行解码后会出现错误。