8

在我的 Python 脚本中,我有要装箱的浮点数。现在我正在做:

min_val = 0.0
max_val = 1.0
num_bins = 20
my_bins = numpy.linspace(min_val, max_val, num_bins)
hist,my_bins = numpy.histogram(myValues, bins=my_bins)

但是现在我想再添加两个 bin 来说明 < 0.0 的值和 > 1.0 的值。因此,一个 bin 应包含 (-inf, 0) 中的所有值,另一个 bin 应包含 [1, inf) 中的所有值

histogram在仍然使用 numpy 的功能的同时,有什么直接的方法可以做到这一点吗?

4

3 回答 3

10

该函数numpy.histogram()愉快地接受bins参数中的无限值:

numpy.histogram(my_values, bins=numpy.r_[-numpy.inf, my_bins, numpy.inf])

或者,您可以使用 and 的组合numpy.searchsorted()numpy.bincount()尽管我认为这种方法没有多大优势。

于 2012-07-24T15:16:06.197 回答
3

您可以指定binnumpy.inf上限和-numpy.infbin 下限。

于 2012-07-24T15:14:11.383 回答
0

使用 Numpy 1.16 版,您拥有histogram_bin_edges. 有了这个,今天的解决方案调用histogram_bin_edges获取垃圾箱,concatenate-inf 和 +inf 并将其作为垃圾箱传递给histogram

a=[1,2,3,4,2,3,4,7,4,6,7,5,4,3,2,3]
np.histogram(a, bins=np.concatenate(([np.NINF], np.histogram_bin_edges(a), [np.PINF])))

结果是:

(array([0, 1, 3, 0, 4, 0, 4, 1, 0, 1, 0, 2]),
array([-inf,  1. ,  1.6,  2.2,  2.8,  3.4,  4. ,  4.6,  5.2,  5.8,  6.4, 7. ,  inf]))

如果您希望最后一个 bin 为空(就像我一样),您可以使用该range参数并添加一个小数字max

a=[1,2,3,4,2,3,4,7,4,6,7,5,4,3,2,3]
np.histogram(a, bins=np.concatenate(([np.NINF], np.histogram_bin_edges(a, range=(np.min(a), np.max(a)+.1)), [np.PINF])))

结果是:

(array([0, 1, 3, 0, 4, 4, 0, 1, 0, 1, 2, 0]),
array([-inf, 1.  , 1.61, 2.22, 2.83, 3.44, 4.05, 4.66, 5.27, 5.88, 6.49, 7.1 ,  inf]))
于 2019-03-20T08:53:15.583 回答