我试图UTF-8
在外语的编码字符串中找到某个字符的索引(或索引)(例如字符:)ش
。
我试过unicode.find('ش')
,word.find(u'ش')
和word.find(u'\\uش')
正则表达式:re.compile(u'\\uش)
无济于事。有趣的是,在调试模式下的 Visual Studio(我使用 IronPython 的 IDE)中,word.find(u'\\uش')
在变量监视窗口中返回正确的索引,但在实际代码中却没有(返回index=-1
)。
我正在使用以下命令从文件中读取字符串:
file= codecs.open(file,'r','utf-8')
有什么我想念的吗?还是有另一种方法来解决这个问题?