我知道你可以使用 Jaccard 指数\距离来衡量两组的相似度/距离。但是,我正在寻找一些方法来缩放原始 Jaccard 值相对于集合的长度。例如,我希望两个具有显着重叠的大集合比两个小集合具有更高的相似性。
当然,我可以简单地将 Jaccard 距离的值除以两组并集的大小,但是有没有为此目的的标准缩放方案?
我知道你可以使用 Jaccard 指数\距离来衡量两组的相似度/距离。但是,我正在寻找一些方法来缩放原始 Jaccard 值相对于集合的长度。例如,我希望两个具有显着重叠的大集合比两个小集合具有更高的相似性。
当然,我可以简单地将 Jaccard 距离的值除以两组并集的大小,但是有没有为此目的的标准缩放方案?