我试图在两个不同的文件中找到中文单词,但它没有用,所以我试图在我得到它们的同一个文件中搜索单词,但它似乎也没有找到它?这怎么可能?
chin_split = codecs.open("CHIN_split.txt","r+",encoding="utf-8")
将此用于正则表达式代码。
import re
for n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read()):
print n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read())
我怎么只能falses
打印???
仅供参考,我尝试这样做并且有效:
for x in [1,2,3,4,5,6,6]:
print x in [1,2,3,4,5,6,6]
顺便提一句
chin_split
包含英文希伯来文和中文的单词
一些行来自chin_split.txt
:
he daodan 核导弹 טיל גרעיני
hedantou 核弹头 ראש חץ גרעיני
helu 阖庐 "ביתו, מעונו
helu 阖庐 שם מלך וו בתקופת ה'אביב והסתיו'"
huiwu 会晤 להיפגש עם