0

我在 Windows 10 和 ubuntu 14.04 LTS 上都使用 python 3.5.1。我有一个列表,其中包含超过一百万个字符串项。项目是土耳其语单词的 unicode 字符串。我使用 in 运算符检查该列表中是否存在某些字符串。大多数答案都是正确的。然而,有些字符串返回 False,即使它们存在于列表中。将列表转换为集合后,我尝试了相同的检查。但什么都没有改变。我该怎么做才能获得正确的结果。谢谢。

我到处都在使用 utf-8 编码。

相关代码在这里

4

1 回答 1

0

问题解决了。但是,这不是列表问题。为了准备列表,我逐行读取相关文件,将其剥离并附加到列表中。在这个过程中,一些物品会丢失。我还不知道原因。但是以下几行创建了准确的列表而没有任何损失:

使用 open("./veri/dertop.txt",encoding="utf-8") 作为 fin: dertop = fin.read().splitlines()

于 2016-02-17T10:10:14.727 回答