假设决策树有 k 个类 (c1,c2,...,ck) 进行分类,父节点的数据集是 D。 Pi 表示标记为 ci 类的元素的比例。基尼杂质是:
如果将节点划分为具有子集 D1 和 D2 的子节点,这些子节点互补且不相交。如何证明:
我知道信息增益不应该是负数,所以应该存在这种不平等。有人可以帮忙吗?
假设决策树有 k 个类 (c1,c2,...,ck) 进行分类,父节点的数据集是 D。 Pi 表示标记为 ci 类的元素的比例。基尼杂质是:
如果将节点划分为具有子集 D1 和 D2 的子节点,这些子节点互补且不相交。如何证明:
我知道信息增益不应该是负数,所以应该存在这种不平等。有人可以帮忙吗?