我正在使用树数据结构并试图想出一种方法来计算我可以从树的节点中获得的信息。
我想知道是否有任何现有技术可以为在较低级别(距树根的距离)出现频率低于相同节点在较高级别和高频率出现的节点分配更高的数值重要性。
举个例子,我想给节点书更多的意义,在第 2 层出现一次,然后在第 3 层出现三次。
将不胜感激任何建议/指向实现类似目标的技术。
谢谢,
普拉泰克
我正在使用树数据结构并试图想出一种方法来计算我可以从树的节点中获得的信息。
我想知道是否有任何现有技术可以为在较低级别(距树根的距离)出现频率低于相同节点在较高级别和高频率出现的节点分配更高的数值重要性。
举个例子,我想给节点书更多的意义,在第 2 层出现一次,然后在第 3 层出现三次。
将不胜感激任何建议/指向实现类似目标的技术。
谢谢,
普拉泰克
这取决于您想在每个级别赋予它多少重要性。
只需乘以随着您向下移动树的级别而减少的数字。例如,n_nodes * 1/(3^n)
,其中 n 是树的级别。因此,第 2 层上的一个节点的值为 1/4,第 3 层上的 3 个节点的值为 1/9。因此,第 2 层上的单个节点更为重要。
根据自己的喜好调整分母。只要它随着 n 的增加而增加,它就会赋予树中更高的节点更多的意义。
我刚刚想到的一个指标是:对于一个标签k
,让它的“价值”是它出现的级别的总和。所以,如果它出现在根和根的左孩子,让它的值为 1。
然后,您最“重要”的标签是那些价值最低的标签。
编辑:这将使根比它的孩子的标签更重要,即使它们都是相同的。因此,按出现次数进行一些缩放可能是有序的。