问题标签 [percentile]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1954 浏览

java - 如何在不使用任何其他库的情况下在 java 中计算百分位数

我正在尝试根据95th Percentile我在下面填充的数据集进行计算ConcurrentHashMap

我很想知道在 95% 的时间内有多少电话回了

我的地图看起来像这样,它总是在键上按升序排序 - 其中

以下是我的地图数据-

例如,从上述数据集中,它意味着

1702 个呼叫在 0 毫秒内返回

15036 个电话在 1 毫秒内返回

现在我可以通过将上述数据集插入到Excel sheet. 但我正在考虑计算 Java 代码中的百分位数。

我知道算法看起来像这样-

对 map 中的所有值求和,计算总和的 95%,按升序迭代 map 键,保持值的运行总和,当 sum 等于或超过先前计算的总和的 95% 时,键应该是第 95 个我猜是百分位。

下面是具有上述数据集的地图。

我不确定我的算法是否也正确。我只是想找出在 95% 的时间内有多少电话回了。

以下是我到目前为止基于上述算法得到的代码。

如果我从上述数据集中计算第 95 个百分位数是否正确,请告诉我。如果也有任何改进,请告诉我。

更新代码:-

下面是我更新的代码,它解决了键的升序问题

谁能看一下,让我知道我是否正确计算了百分位数?

0 投票
0 回答
226 浏览

performance - 从 2D numpy 数组中找到 5%ile 的最快方法?

我知道有numpy.percentile(myArray,5),但我知道在幕后这将首先对数组进行完整排序,如果我只需要排序最小的 5% 的值,这是低效的。我还读到堆排序方法对这个部分排序问题很有用,但我似乎找不到适用于 2D numpy 数组的实现。

这是我尝试过的:

这在我的系统上大约需要 15 毫秒(对于我的实时应用程序来说太慢了)。

尝试堆:

在我的系统上花费 300 毫秒;我希望 heapq 可以加快速度!

0 投票
0 回答
64 浏览

excel - 按条件引用数据表

我正在尝试使用与在 Excel 数据透视表中使用 QUARTILE 类似的公式,将子群体的数据汇总到 Excel 2013 中。

语法是:=MAX(IF(Model[MHH]=10112,Model[Ta],""))

它应该只在 1 月的第一个小时获得所有 Ta(室外温度)的最大值。该数据表称为“模型”,包含三年的小时值,其中 [M] 表示月份,[HH] 表示小时。我想对 PERCENTILE 函数做同样的事情,所以 DMAX 函数不起作用。

1MMHH我一起计算了月份值和小时值,以获得“月-小时”的值,以便可以参考一个标准,即月份和小时的组合,格式如下:成为一个数字。
但是,如果我执行公式,它会返回#VALUE.

如果我评估公式,它会在 处给出这个错误Model(MHH),而如果我只使用公式=MAX(Model(MHH)),它给出所有值的最大值。

0 投票
1 回答
9317 浏览

python - 在使用 numpy.median 之前对数据进行排序

我正在使用 Python 测量数据样本的中位数和百分位数。

np.sort()在测量中位数之前,我是否必须对我的数据使用该函数?

0 投票
2 回答
21265 浏览

python - 在 python 中计算列表值的 95%

我的程序中有一本字典,每个值都是响应时间列表。我需要计算每个列表的 95% 响应时间。我知道如何计算平均值,但不知道 95% 的计算。任何指针将不胜感激。

以下是我的程序的字典输出

finalvalues = {' https://lp1.soma.sf.com/img/chasupersprite.qng?v=182-4 ': ['505', '1405', '12', '12', '3'] , ' https://lp1.soma.sf.com/img/metaBar_sprite.dsc ': ['154', '400', '1124', '82', '94', '108']}

0 投票
1 回答
1021 浏览

r - 剪切数据和访问组以绘制百分位线

我对 R 很陌生,所以请温柔一点。

我有一个包含时间戳和一些数据的数据集。现在我想画一个图表,其中:

  • 数据按例如 60 分钟的间隔分组,并且
  • 绘制了一些百分位线。

我想要一个图表,时间为 x 轴,间隙为 y 轴。我想像 boxplot 之类的东西,但为了更好地概述 - 因为我有一个很长的测量值 - 而不是盒子,我希望有连接线的线

  • 平均值,
  • 3个百分位,
  • 97% 和
  • 100 个百分位

这是一个示例数据:

我可以使用 cut 来划分数据:

或者

但是我怎样才能画出这个图表呢?我不知道如何访问组的差距值。否则我可以

提前感谢拉蒙的任何帮助

0 投票
1 回答
204 浏览

r - 在点阵直方图中如何只保留 99% 的数据?

在我的格子直方图中:

如何将“账单”数据保留在每组内第 99 个百分位之前?

0 投票
1 回答
4830 浏览

r - 如何为因子变量的每个级别应用函数?

我有这样的功能:

目的是去除位于数据前 1% 的异常值(用 NA 替换它们的值)。如何在因子变量的各个级别上应用此函数?

例如,

具有 A 组和 B 组的原始数据集:

最终应该是这样的:

我已经尝试过,tapply,sapply,但是这些都改变了数据集输出的结构。

0 投票
3 回答
587 浏览

sql - TSL / SQL PERCENTILE_CONT 应该返回 1 条记录

我正在处理一个 T-SQL 查询(我正在运行一个 SQL Server 数据库),它应该从值列表中计算中位数。查询如下所示:

数据库有 100 行。查询返回中位数(相同的值)100 次,但我的目标是只返回一次。我一直在尝试以多种方式使用DISTINCTGROUP BY,但每次都会返回语法错误。DISTINCT目前数据库不支持。

我有没有可能忽略一些明显的东西?

0 投票
1 回答
7076 浏览

excel - 计算一个值的百分位数,仅给出第 25、50 和 75 个百分位数

这可能是也可能不是发布此问题的正确论坛,但我希望是最好的。

目前,我们正在尝试根据我们公司每个职位的第 25、50 和 75 个百分位计算给定工资值的百分位。仅给定三个数据点(每个位置的第 25、第 50 和第 75 个百分位数),我不确定如何解决这个问题。

例如,我们每年向员工 A 支付 7.2 万美元,该职位的数据为:6.6 万美元(第 25 个百分点)、7.2 万美元(第 50 个百分点)和 8 万美元(第 75 个百分点)。显然,员工 A 的薪水处于第 50 个百分位。有很多员工的薪水排列得不太好,所以如果有人知道如何解决其他薪水金额的百分位数,我将不胜感激!

我一直在尝试创建一个公式来计算每个薪水的百分位数,并且到目前为止失败得很惨……有没有办法做到这一点?感谢您的时间和帮助!