在hierarchical k-means中,深度为D、分支因子K的词汇树应该有如下的节点总数(不包括根节点):
nodes = K + K^2 + ... + K^D
nodes = (K^(D+1)-K)/(K-1)
但是,vl_hikmeanshist
给出带有一个额外 bin 的直方图。在他们的网站上,节点数计算为:
nodes = (K^(D+1)-1)/(K-1)
他们还说他们“不计算没有信息的根”。那么为什么他们的公式不同呢?他们没有在网站上发布他们的联系方式,所以我无法询问他们。有人可以解释一下这个问题吗?