0

条件购物车中的“权重”和“权重”是什么?

我正在使用 CARTS 通过递归分区来分析一个小数据集(N=70)。具体来说,ctree 函数形成了 R 中的派对包。

我对什么是“权重”和“权重”有点困惑。据我了解,他们将每个节点的最终观察次数称为“权重”。但是,也可以将“权重”设置为具有条件树的模型中的重要性度量,我称之为“统计权重”。

我将一个分类变量设置为“统计权重”,我不确定软件在后面做什么,但是每个节点的样本大小(N =“权重”)突然比初始值大 5.5 倍(N = 400)一,总样本量(N = n1+n2+n3..))取决于最小桶和最大深度。我认为该模型只会考虑此类变量的可重复性并在模型中对其进行权衡。我理解为什么节点的样本大小会有所不同,但我没想到总 N 是可变的。

我已经多次阅读了patry手册,还尝试了partykit包。我读了又读,这些概念可能得到了解释,但是在推理树中添加“统计权重”时,我对获得如此大的样本量(“权重”)感到困惑。

4

1 回答 1

0

经过很多,我终于发现有人在这里问过同样的问题: https ://stats.stackexchange.com/questions/178993/defintion-of-the-terms-node-weight-and-case-weight

于 2021-04-27T13:35:10.387 回答