1

我有来自文件/文件夹结构的分层数据,用于构建树。我现在正在尝试将这些树与随机树以及它们之间进行比较。

为了与随机树进行比较,我可以保留叶节点的数量和标签,并使用传统的树距离度量(例如 Robinson-Foulds 距离)。尽管如此,要比较来自不同数据的不同树(具有不同数量的叶子和标签),我不知道要使用哪种度量/算法。有什么建议么?

谢谢!

PS-比较的目标是确定这些树之间的拓扑结构有多相似,并查看可能存在哪些集群(并因此添加一些关于文件夹结构背后的生成机制的想法的证据)。

4

0 回答 0