我试图得到一个分数,告诉我一个值是否属于分布的概率。得分可能我错误地称为可能性。例如:
A = [4,5,5,6,4,16,15,14,15,16]
b = 5
在这种情况下,我的分数应该很低,即使 b = 15 我也想要一个低分,否则如果 b = 10 我会得到高分,或者如果 b = 100 会更糟。
我尝试使用核密度在我的数据 A 上拟合高斯混合,然后尝试获得 b 的分数。但这似乎不是我真正想要的。
kde = KernelDensity(kernel='gaussian').fit(A)
score = kde.score(b)
您对以更好的方式对问题建模有什么建议吗?
编辑:A 是从神经网络生成的值列表,b 是我试图预测的真实值。KernelDensity 似乎不太好,因为例如当 A 和 b 是:
A = [40,50,50,60,40,160,150,140,150,160]
b = 50
分数高于第一种情况,但应该相同。