我怎样才能摆脱离散数据集中的火花数据,但以“更顺畅”的方式?
举个例子
有两个火花,在 20000,但下一个在 600 也被认为是火花。
我已经设法将非常高的值归零,通过
a = 2
b = 5
beta_dist = RealDistribution('beta', [a, b])
f(x) = x / 19968
normalized_insertions = [f(i) for i in insertions]
insertions_pairs = [(i, beta_dist.distribution_function(i)) for i in normalized_insertions]
plot_b = beta_dist.plot()
show(list_plot(insertions_pairs)+plot_b)
不知道如何处理较低的。最大值应该达到 100,也许 beta 分布的参数需要更多的调整?
目前,它看起来像这样:
如果可能,请使用鼠尾草作为解释的参考。