我有一个具有以下属性的测量列表:
- 测量是昂贵的。更少的测量 -> 更好
- 他们都是积极的。事实上,有一个正的下限,我无法得到任何低于该值的值。这个下限是我需要有信心知道的。
- 它们将分布在一个或多个中值附近
- 我知道当我发现一个离群值小于时,还有另一个“更好”的中位数,
median - 2*variance
因为“最佳”中位数和下限之间的距离总是小于正态分布宽度的两倍
目标:找到具有最少迭代次数的最佳中位数,置信度为 90%。
我更喜欢最小值,但最小的中位数就足够了。
我正在寻找的是一段代码,我在其中提供测量值,它告诉我中位数以及这个中位数是我寻找的那个的信心。
背景:我想计时Java方法。我可以运行几分钟的测试来平均异常值,但是在查看数据时,对于人类来说,很明显这些值会迅速累积在中值附近。
除非 JIT 启动并且中位数突然跳跃。最终,您将得到一条在最小中位数左侧非常陡峭的曲线(即,中位数左侧的方差很低)和右侧的长而柔和的斜坡,其中 pre-JIT 有一个凸起中位数是。
testConnect-count.csv
是值的直方图,testConnect-history.csv
是测量序列。目标是找到一种算法,该算法115000
通过从testConnect-history.csv