python 和 lxml 的新手,所以请多多包涵。现在卡住了似乎是 unicode 的问题。我尝试了 .encode,美丽的汤的 unicodedammit 没有运气。搜索了论坛和网络,但我缺乏 python 技能未能将建议的解决方案应用于我的特定代码。感谢任何帮助,谢谢。
代码:
import requests
import lxml.html
sourceUrl = "http://www.hkex.com.hk/eng/market/sec_tradinfo/stockcode/eisdeqty.htm"
sourceHtml = requests.get(sourceUrl)
htmlTree = lxml.html.fromstring(sourceHtml.text)
for stockCodes in htmlTree.xpath('''/html/body/printfriendly/table/tr/td/table/tr/td/table/tr/table/tr/td'''):
string = stockCodes.text
print string
错误:
UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 0: ordinal not in range(128)