1

我一直在使用 scipy.stats.gausian_kde 但对其输出有一些疑问。我在同一张图上绘制了归一化直方图和 gaussian_kde 图。为什么 y 值差异如此之大?我的理解是 gaussian_kde 图应该大致触及直方图的尖端。使用 scipy.integrate.quad 函数,我确定图表下方的面积为 0.7,而不是 1.0,这是我的预期。

实际上我真正想要的是让 gaussian_kde 代表非标准化直方图,有谁知道我该怎么做?图表在这里

4

1 回答 1

2

你的期望有点偏离。每个 KDE 峰下的面积应大致等于其相应条形中的面积。在我看来,这似乎成立。具有全局带宽估计(如scipy.stats.gaussian_kde)的非自适应 KDE 倾向于扩大具有尖峰的多峰分布。

至于对 KDE 下总面积的低估,我不能说没有您用来进行集成的数据和代码。

为了使 KDE 近似于未归一化的直方图,您需要乘以(bin_width*N)whereN是数据点的总数。

于 2013-04-18T17:57:21.770 回答