我正在使用 python2.7 和 lxml 来获取页面。我不断收到以下错误。
(<type 'exceptions.UnicodeEncodeError'>, UnicodeEncodeError('ascii', u'Approximate Dimensions: 4\xbd" x 4" x 7" (assembled)', 25, 26, 'ordinal not in range(128)'), <traceback object at 0x7f9198ac48c0>)
我尝试了以下方法:
doc = lxml.html.document_fromstring(html)
for el in doc.iter('h2'):
el.text_content().decode('utf-8','ignore')
OR
el.text_content().encode('ascii', 'ignore')
如何解决这些错误?我需要能够 1)保存到文本文件,然后 2)将文本文件上传到 MySQL。
谢谢