我想知道如果输入是两个字符串并且输出应该是两个字符串中重复出现的单词的数量,是否有一个库或函数可以返回一个数字......
输入:
string 1= my name is user
string 2= my friend is here
输出:
2
因为“my”和“is”在两个字符串中都重复...我听说 nltk 可以帮助我,如果真的有人可以指导我使用这个功能...请帮帮我
不确定nltk
- 似乎有点矫枉过正(除非您想要一些高级标记化)。如果您可以仅通过空格来标记单词,那么您可以使用如下集合:
>>> a = 'one two three four five'
>>> b = 'three blind mice'
>>> set(a.split()).intersection(b.split())
set(['three'])
并采取的长度...
res=set(a.split())&set(b.split())
print len(res)