我在 html 文档中有以下文本:
<a href="#">�'ам интересна информация</a>
我正在使用以下表达式来提取文本:
row.xpath("string(./td[@class='col2 td-tags']/h3/a/text())")
这个表达式适用于简单的英语,但对于上面的字符串,它会抛出这个错误:
'utf8' codec can't decode byte 0xd0 in position 0: invalid continuation byte