我想订购计算与多个并发文本匹配的匹配度的结果。我想计算部分匹配到文本搜索的搜索集合,例如特定字符、二元组、前缀。
我想使用 bash、awk、命令行工具或单行工具,而无需编写其他脚本。
例如,假设我想按单词中包含的5 个最常见的英语二元组[ th
, he
, in
, er
, ] 的计数进行排序:an
带有示例单词表
abashed
abashedly
abashedness
abhenry
abolisher
not
(从grep he /usr/share/dict/words | head -n5
,添加了不匹配项)。
我要输出
2 abolisher
1 abhenry
1 abashedness
1 abashedly
1 abashed
0 not