拿这本词典:
{'local': {'count': 7,
'dining-and-nightlife': {'count': 1,
'bar-clubs': {'count': 1}
},
'activities-events': {'count': 6,
'outdoor-adventures': {'count': 4},
'life-skill-classes': {'count': 2}
}
}}
我如何确定最相关的匹配(在 30% 的余地内)?例如,activity-events 的计数为 6,因此 6/7 = 85%,其子户外冒险的计数为 4 out 6 (66%)。因此,最相关的类别是户外探险。
在这个例子中:
{'local': {'count': 11,
'dining-and-nightlife': {'count': 4,
'bar-clubs': {'count': 4}
},
'activities-events': {'count': 6,
'outdoor-adventures': {'count': 4},
'life-skill-classes': {'count': 2}
}
}}
将餐饮和夜生活 (33%) 与酒吧俱乐部 (100%) 结合起来,将活动活动 (54%) 与户外探险 (66%) 结合起来。
我希望百分比截止值由
cutoff = 0.3
这里的想法是确定哪个类别最相关,删除较小的结果(低于 30%)匹配。
@FJ 在下面回答了这个问题,但现在我希望更新树中的计数。
初始输出:
{'local': {'activities-events': {'count': 6,
'life-skill-classes': {'count': 2},
'outdoor-adventures': {'count': 4}},
'count': 11,
'dining-and-nightlife': {'bar-clubs': {'count': 4}, 'count': 4}}}
帖子输出:
{'local': {'activities-events': {'count': 6,
'life-skill-classes': {'count': 2},
'outdoor-adventures': {'count': 4}},
'count': 10,
'dining-and-nightlife': {'bar-clubs': {'count': 4}, 'count': 4}}}