我有一个文件,我试图在其中获取短语计数。在某些文本行中,我需要计算大约 100 个短语。作为一个简单的例子,我有以下内容:
phrases = """hello
name
john doe
"""
text1 = 'id=1: hello my name is john doe. hello hello. how are you?'
text2 = 'id=2: I am good. My name is Jane. Nice to meet you John Doe'
header = ''
for phrase in phrases.splitlines():
header = header+'|'+phrase
header = 'id'+header
我希望能够得到如下所示的输出:
id|hello|name|john doe
1|3|1|1
2|0|1|1
我把标题放下了。我只是不确定如何计算每个短语并附加输出。