我正在尝试搜索文件 1 中每个文件包含一行的印地语单词,并在文件 2 中的行中找到它们。我必须用找到的字数打印行号。这是代码:
import codecs
hypernyms = codecs.open("hindi_hypernym.txt", "r", "utf-8").readlines()
words = codecs.open("hypernyms_en2hi.txt", "r", "utf-8").readlines()
count_arr = []
for counter, line in enumerate(hypernyms):
count_arr.append(0)
for word in words:
if line.find(word) >=0:
count_arr[counter] +=1
for iterator, count in enumerate(count_arr):
if count>0:
print iterator, ' ', count
这是查找一些单词,但忽略了其他一些输入文件是: File-1:
पौधा
वनस्पति
文件 2:
वनस्पति, पेड़-पौधा
वस्तु-भाग, वस्तु-अंग, वस्तु_भाग, वस्तु_अंग
पादप_समूह, पेड़-पौधे, वनस्पति_समूह
पेड़-पौधा
这给出了输出:
0 1
3 1
显然,它忽略了वनस्पति,只搜索पौधा。我也尝试过其他输入。它只搜索一个词。知道如何纠正这个问题吗?