问题标签 [quartile]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
13476 浏览

sql - 在 SQL 中计算百分位数

这应该很简单,但作为 SQL 的新手,我真的很挣扎。有人建议我将 PERCENTILE_CONT 与连续(非离散)数据一起使用。

有问题的数据涉及两列:(1)患者列表的 ID 和(2)每年的平均事件数。

根据我在网上找到的一些代码工作,这就是我要做的

这似乎只是报告了每个具有相同 PPPY 值的列。

知道我哪里出错了吗?

0 投票
2 回答
103 浏览

sql - SQL 窗口函数 - 无法分组后如何处理

这是我第一次在这里发帖。几个月来我一直在悄悄地浏览论坛。

我正在尝试显示类别名称、四分位数和每个四分位数的标题数。这是我的 SQL 代码:

但是,因为我无法按四分位数分组(它是一个窗口函数),所以它没有按我的意愿显示结果。我认为将它放在子查询中可能会使其工作,但事实并非如此。我认为另一个问题是一个四分位数可以有多个与之相关的租赁期限数字。

这是它的样子:

动画1 12
动画1 18
动画2 9
动画3 13
动画4 14
儿童1 12
儿童2 9
儿童2 15
儿童3 13
儿童4 11

如果有人能指出我正确的方向或有有用的提示,我将不胜感激。

计数和分组是我要解决的问题。如果您在显示结果的片段中看到,动画有两个 1 四分位数,儿童有两个 2 四分位数。每一种都应该有。但是由于我不能按四分位数分组,因为它是一个窗口函数,所以它是按rental_duration 分组的。

谢谢!:)

PS - 这就是它应该看起来的样子:

预期查询结果截图

0 投票
1 回答
1312 浏览

arrays - Excel:如何将多个条件添加到中位数和第一四分位数的数组计算中

我有一个关于我现在正在处理的大型 excel 文件的问题。

我在较大的数据列表中有一长列值(B 列)。在 CI 列中,与数据列表中的另一个值有连接,根据不同的条件,该值可以是 TRUE 或 FALSE。

在此处输入图像描述

我已经设法使用以下公式创建了两个数组函数,用于计算 B 列中值的中位数和第一个四分位数,其中 C 列中的值为 TRUE。只要相应行的 C 列中的值等于 TRUE,它们就会计算 B 列中值的中位数和第一个四分位数。

现在我想在计算中添加另一个条件。除了 C 列中的值等于 TRUE 之外,如果 A 列中的值等于“测量 1”或任何其他动态值,我还只想计算中位数和第一个四分位数。我试图在下面嵌套 AND 函数,但它根本不起作用。

谁能帮助我解决如何根据多个标准向数组添加值,然后计算该数组的中位数和四分位数?

0 投票
2 回答
691 浏览

r - R:为面板数据中的每个日期创建具有四分位数排名的列

我有以下面板数据:

我想要一个新列,它向我显示每个日期的四分位数,如下所示:

使用该功能:

只给我基于所有销售价格的四分位数排名,并且不区分日期。

0 投票
2 回答
4795 浏览

sql - 如何计算分组的四分位数?

假设我有一张桌子

我想计算每个人的四分位数。

我知道我可以很容易地为一个人计算这些:

会给我想要的结果:

问题是,我想为每个人做这个。我知道这样的事情可以完成这项工作:

但是如果桌子上有一个新人怎么办?然后我必须更改 SQL 代码。有什么建议么?

0 投票
1 回答
176 浏览

python - 改变四分位数范围

我有一些数据

当我使用 describe 函数时,我得到以下结果:

我得到的结果显示了 0 到 25%、25% 到 50% 和 50% 到 75% 的数据。我想得到结果,它显示结果为 10%、20%、30%……等等。请让我知道如何获得这些结果。

0 投票
1 回答
67 浏览

javascript - Javascript中的递归四分位数排序器

我正在用 Javascript 构建一个四分位排序器。Codepen 如下。将表格中的标题拖到表格上方的灰色区域以查看表格排序。 https://codepen.io/carbondesign/pen/MPPRPW?editors=0010

这段代码除了 2 个问题外都可以正常工作: 1. 我写得很长,以便为自己解决问题 2. 按第三列排序不起作用。

要查看#2,将“区域”拖入分类框(表格上方的灰色区域),表格按预期排序(俄罗斯是最大的国家)。将“人口”拖入排序区域,表格按预期排序(中国是最大、人口最多的国家)。将“人口增长率”拖入分类区域,它几乎可以工作,但并不完全。我得到双倍值,排序顺序应该如下,伊拉克是最大、人口最多、增长率最高的国家。

  • 伊拉克 2.93
  • 埃塞俄比亚 2.89
  • 坦桑尼亚 2.79
  • 安哥拉 2.77
  • 喀麦隆 2.59
  • 马达加斯加 2.58
  • 也门 2.47
  • 尼日利亚 2.45
  • 刚果 2.45
  • 莫桑比克 2.45
  • 阿富汗 2.32
  • 肯尼亚 1.93
  • 阿尔及利亚 1.84
  • 埃及 1.79
  • 苏丹 1.72
  • 印度 1.22
  • 巴基斯坦 1.46
  • 沙特阿拉伯 1.46
  • 委内瑞拉 1.39
  • 南非 1.33
  • 土耳其 1.26
  • 伊朗 1.2
  • 墨西哥 1.18
  • 澳大利亚 1.07
  • 哥伦比亚 1.04
  • 缅甸 1.01
  • 摩洛哥 1
  • ...

有问题的代码从第 154 行开始(同样,我是故意写出来的):

所有建议表示赞赏。

0 投票
2 回答
763 浏览

excel - Excel - calculate quartile and median to generate box plot given a list of values and counts

I have a rather simple task to achieve but I am not sure how to do that in excel.

I have a list of values and number of counts of each value (my variable is discrete). I am trying to calculate 1st and 3rd quartiles of the variable given the counts I have. Overall dataset will be too large to fit into excel in raw format so I am using matrix of value counts.

Example:

I need to generate 1st, 3rd quartile and median out of this dataset, but as far as I see excel's quartile accepts only raw values, not values and their counts.

0 投票
2 回答
1894 浏览

r - 添加水平分位数线到散点图ggplot2 R

我有下面的数据

我想制作一个scatterjitter实际上)图并在沿 y 轴的不同点添加水平线。我希望能够自定义添加行的百分位数,但是现在,像 R 的摘要函数这样的东西就可以了。

我在下面有抖动图的代码。它运行并生成图表,但我不断收到错误消息:

每组仅包含一个观察值。需要调整群体审美吗?

我试着看这个问题 -

ggplot2折线图给出“geom_path:每个组只包含一个观察值。你需要调整组审美吗?”

它建议将所有变量设为数字。我的周期变量是一个字符,我想保持这种状态,但即使我将它转换为数字,它仍然会给我错误。

任何帮助,将不胜感激。谢谢!

0 投票
1 回答
129 浏览

r - 如何在 R 的“调查”包中按年龄组复制 SUDAAN 75% 和 95% 置信区间?

我正在尝试使用 NHANES 数据在 R 中的“调查”包中复制来自 SAS 和 SUDAAN 年龄组的分位数估计,置信区间为 95%。包的 'svyby' 函数与它的 'svyquantile' 函数相结合,使您可以很容易地执行此分析;我的结果很接近,但与 SUDAAN 生成的结果不完全相同。

我相信这可能是由于“svyby”和“svyquantile”函数允许您自定义的一些参数。'svyquantile' 函数采用的参数包括 'method'、'interval.type'、'ties、'interval.type'、'return.replicates' 等。

我发现这篇文章解释了如何使用“调查”包复制一些 SUDAAN 函数,但没有解释如何复制分位数估计。通过对 SUDAAN 如何估计分位数的一些研究,我认为应该将“方法”参数设置为“线性”。除此之外,我尝试将各种参数设置为不同的参数,但没有准确地复制 SUDAAN 估计值。

有谁知道如何按组复制 SUDAAN 分位数估计和 95% 置信区间,或者有关于 SUDAAN 使用的方法的任何文档,以便使用 R 中的“调查”包更好地复制此分析?

在下面的代码中,我展示了我的方法。'svyby' 函数的结果似乎是合理的估计,但是,它们与 SUDAAN 和 SAS 产生的结果不同。我无法使用 SUDAAN 和 SAS,但我的目标是在 R 中复制他们的结果。具体来说,根据 SUDAAN 和 SAS 的 PCB 118,60 岁以上年龄组的第 75 个百分位数是 25.89 ng/g 脂质(95% CI:22.97-30.17)。谢谢你。