我的数据本质上与此处的 SO 帖子相似:
但是,相反,我有:
mylist = [['hello', 'there'], ['hi', 'there'], ['hello', 'there']]
我试图计算重复短语的数量,因此,在这种情况下,我观察 ['hello', 'there'] 两次,另一个观察一次。
我遇到了熟悉的TypeError: unhashable type: 'list'错误,但是在我的示例中格式化了数据结构,我无法找到相关的解决方案。
以上可能是由n每个单独列表中的总单词组成的短语,但并非总是如此n=2。
在这种情况下努力获得频率计数,因此任何指导表示赞赏。