我正在努力将 3 个单词的句子与两个单词的 digram 字典匹配,该字典计算(第 1 个单词和第 2 个单词)和(第 2 个单词和第 3 个单词)的频率。我想要的是如何匹配字符串(AAA BBB CCC)在二元组中并且(AAA BBB)有一个计数并且(BBB CCC)有一个计数然后我们取最大值?
Counter({
('BBB', 'DDD'): 3,
('AAA', 'BBB'): 2,
('DDD', 'XXX'): 1,
('DDD', 'YYY'): 1,
('YYY', 'BBB'): 1,
('BBB', 'CCC'): 1,
('CCC', 'AAA'): 1,
('XXX', 'BBB'): 1})