我标记了这个问题,poisson
因为我不确定它在这种情况下是否有帮助。
我需要从数据列表中创建一个分布(可能最终格式化为图像)。
例如:
data = [1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 10, 10, 10, 22, 30, 30, 35, 46, 58, 59, 59]
以便数据可用于创建可视分布。例如,在这种情况下,我可能会说范围在 10 中,并且每个范围中至少需要 3 个项目才能成为有效点。
有了这个示例数据,我希望结果类似于
ditribution = [1, 2, 4, 6]
因为我在 0-9、10-19、30-39 和 50-59 范围内有 > 3 个项目。使用该结果,我可以生成一个图像,该图像具有在我的最终分布中存在的部分被分割出来(较深的颜色)。我正在尝试创建的图像类型的示例如下所示,并且会使用更多数据生成。暂时忽略蓝线。
我知道如何以蛮力的方式迭代列表中的每个项目并像这样进行计算。但是,我的数据集可能有数十万甚至数百万的数字。在现实世界的示例中,我的范围 (10) 和所需的项目数 (3) 可能会大得多。
谢谢你的帮助。