0

我正在从一个网站上提取数据,当查看源代码<td class="xxx">&nbsp;</td>时使用<td class="xxx">Tá</td>. 我正在尝试针对该 td 中的数据。现在它是空的。像下面这样的东西没有用,因为这不是 Ascii 字符。帮助!!:

result = <td class="xxx">&nbsp;</td>

#Check to see if it is returning an empty string
if not result:
    print 'empty'
4

1 回答 1

0

我一直在使用Unidecode包来帮助我解码上游客户传递给我的 unicode。它似乎适用于我当前的所有测试用例。基本上它需要 unicode 并尝试将其转换为 ASCII 等价物。

于 2013-11-05T20:48:29.497 回答