我想创建一个表格,显示某些单词在 3 个文本中的频率,而文本是列,单词是行。
在表格中,我想查看哪个单词在哪个文本中出现的频率。
这些是我的文字和文字:
texts = [text1, text2, text3]
words = ['blood', 'young', 'mercy', 'woman', 'man', 'fear', 'night', 'happiness', 'heart', 'horse']
为了创建条件频率分布,我想创建一个看起来像 lot = [('text1', 'blood'), ('text1', 'young'), ... ('text2' , '血液'), ...)
我试图创造很多这样的:
lot = [(words, texte)
for word in words
for text in texts]
而不是 lot = ('text1', 'blood') etc. 而不是 'text1' 是列表中的整个文本。
如何创建用于条件频率分布函数的元组列表?