我正在阅读网页内容并检查带有变音符号的单词。该词出现在页面内容中。但是pythonfind('ü')
函数没有找到这个词。
import urllib2
opener = urllib2.build_opener()
page_content = opener.open(url).read()
page_content.find('ü')
我试图用 u'ü' 转换搜索字符串。那么错误是
'SyntaxError: (unicode error) 'utf8' codec can't decode byte 0xfc in position 0'
我在我的 .py 文件中使用了 # - - coding: utf-8 - -。
我已经打印了 page_content。那里的变音符号 ü 正在转换为 'ü'。如果我尝试使用 page_content.find('ü'),它工作正常。请让我知道是否有更好的解决方案。
我将不胜感激任何建议。