0

在二进制分类数据集上使用 Orange 的 Distribution 小部件时,可以选择显示所有特征值的给定类标签的概率的置信区间,请参阅:Distribution Widget Doc

这些间隔是如何计算的?我尝试使用关键字搜索github 存储库:“分布”、“置信区间”。但只找到了小部件 UI 的代码,没有找到实际统计数据计算位置的指针。

4

1 回答 1

0

它在 OWDistributions.py ( code )的 calcHistogramAndProbGraph 方法中完成,该方法是分发小部件的代码。

对于离散特征,它只是观察到的比率。对于连续特征,它调用 C++ 代码(我假设)将特征离散化并以类似的方式估计概率。

于 2015-08-03T12:32:11.650 回答