我有一个非均匀数组'A'。
A = [1,3,2,4,..., 12002, 13242, ...]
我想探索数组“A”中有多少元素的值高于某个阈值。
例如,有 1000 个元素的值大于 1200,所以我想绘制值大于 1200 的元素的数量。此外,还有其他 1500 个元素的值大于 110(这包括 1000 个元素,其值大于 1200)。
这是一个相当大的数据集,所以我不想省略任何类型的信息。
然后,我想绘制值 A 与 Log (A) 之上的元素“N”的数量,即
**'Log N(> A)" vs. 'Log (A)'**.
我想对数据进行分箱,但我相当不成功。我没有在 python 中做过那么多的统计,所以我想知道是否有一种很好的方法来绘制这些数据?
提前致谢。