问题标签 [quartile]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
7953 浏览

r - 为什么我的数据中的第三个四分位数小于平均值?

我将一个名为 gob 的数据集加载到 R 中并尝试了方便的summary功能。请注意,第三个四分位数小于平均值。怎么会这样?是我的数据大小还是其他类似的东西?

我已经尝试为digits 参数传入一个较大的值(例如10),但这并不能解决问题。

请注意,对于 gob$100201.D,平均值是 0.0000878,但第三个 Qu。= 0。

0 投票
2 回答
725 浏览

statistics - 将数据分成四分位数

我有一个数据集,其中包含与我们合作的所有提供商的录取率。我需要将这些数据分成四分位数,以便每个提供商都可以看到他们的费率与其他提供商相比的位置。比率从 7% 到 89% 不等。谁能建议我如何做到这一点?我不确定这是否是提出这个问题的正确地方,但如果有人可以帮助我解决这个问题,我将不胜感激。

另一个问题是,如果提供者的数量非常小,例如:2/4 = 50%,则提供者可能会落入更差的四分位,但这并不意味着提供者的表现很差,因为数量太少了。我希望这是有道理的。如果我能进一步澄清,请告诉我。

0 投票
1 回答
1612 浏览

python - 将连续颜色图中的颜色与 matplotlib 中的特定值相关联

我试图找到一种将某些数据值与连续颜色图中的特定颜色相关联的方法。

我有一个特定的图像,其值范围为[min, max],我希望以下值[min, q1, q2, q3, max](指四分位数)与所选颜色图q'n'中对应的颜色相关联。[0, 0.25. 0.5, 0.75. 1.0]结果,颜色放大器的中点将对应于图像中的中值,依此类推......

我一直在环顾四周,但我无法找到一种方法来做到这一点。

0 投票
1 回答
1065 浏览

r - 从for循环在R中连续到离散切割四分位数

我正在尝试创建一堆基于多列的四分位数切割列。例如,

我想根据从第 50 列到第 60 列的连续变量的分箱创建新的第 412 到 422 列。当我尝试执行上述代码时,我得到的只是

我不确定我哪里出错了。任何帮助将不胜感激!!!

0 投票
2 回答
48 浏览

mysql - 可移动权重的数据库项目排名

所以我有一个我认为是一个非常独特的问题。我需要计算一个非常大的项目表(200,000ish)的排名。他们的“排名”基于几个加在一起的加权属性。1-4 级的 7 个属性(基于它们的四分位数 1 底部四分位数 4 顶部),每个属性最初均等加权,然后加在一起(7-28 级)。我希望允许用户调整属性的权重,使它们中的任何一个或所有属性的重要性增加一倍或一半。这可能会改变他们的最终排名。我正在寻找是否有人处理过类似的问题或对从哪里开始有任何想法。谢谢!

0 投票
2 回答
653 浏览

r - 使用 cut2(不带 [ )符号在 Hmisc 中获得良好的切割

我目前正在尝试使用Hmisc包巧妙地切割数据,如下例所示:

所产生的削减就值而言是正确的:

但是,我希望数据的呈现方式略有不同。例如,而不是

[ 1, 251 )

[ 251, 501 )

我更喜欢这个符号

1 - 250

251 - 500

由于我在多个变量上做了很多这样的事情,我对一个易于应用于多个变量的可重现解决方案感兴趣。


编辑

在评论中的讨论之后,解决方案必须处理更混乱的变量,例如x2 <- runif(100, 5.0, 7.5).

0 投票
1 回答
448 浏览

mdx - 尝试在 MDX 中计算四分位数

我的数据如下所示:

大约有一百万行。列名 *ID 引用其他表,因此它们可以用作维度。

我有一个 OLAP 多维数据集,其列吞吐量为度量,其余为维度。

我想计算吞吐量度量的四分位数 1 和 3。

我遵循了本指南:https ://electrovoid.wordpress.com/2011/06/24/ssas-quartile/ 以及这篇文章:在分析服务中计算四分位数

从我尝试使用此 MDX 查询的那些:

但我得到:'Query (6, 7) ID 层次结构在 Crossjoin 函数中多次使用。'

我对 OLAP 和 MDX 很陌生。任何想法有什么问题以及我应该如何正确计算四分位数?

我在某处读到,在计算四分位数时,我需要 ID 维度才能获得包含所有值而不是聚合值的集合......

0 投票
1 回答
380 浏览

r - 我想在 R 中为特定值创建四分位数。我想按类别创建四分位数。我怎样才能做到这一点?

例如:A 类和 B 类的平均价格分别为 X 和 Y。这两个类别都包含产品数量。我想根据每个类别的平均价格创建四分位数。

0 投票
1 回答
2260 浏览

r - R函数计算相邻标准差之间的正态曲线下面积

我正在研究 GoF(拟合优度)测试,并想查看数据向量的分位数是否遵循正态分布 N(0, 1) 的预期频率,并且在运行卡方检验之前,我生成正态分布的这些频率:

< -2 SD's(标准差),-2 and -1 SD's 之间,-1 and 0SD 之间,0 and 1SD 之间,1 and 2 SD's 和more than 2 SD's 之间。

为此,我走了很长的路:

我看到对称性允许我减少代码的长度,但没有更简单的方法......一些东西(我认为这不会起作用,但......的想法)就像pnorm(-2:-1)返回一个相同的价值pnorm(-1) - pnorm(-2) = 0.13590512

问题:是否有一个 R 函数可以计算分位数之间正态曲线下的面积,以便我们可以c(-3:3)通过它传递一个向量,而不是减去pnorm()相邻标准差或其他分位数的 's?

0 投票
1 回答
244 浏览

excel - 在excel中查找四分位数的不同策略

让我们考虑以下数据

我想找到`Q1,Q2,Q3,让数据排序

在excel中我们可以很容易地计算出来

结果是

但是如果我们手动计算,我们会得到以下结果

为什么结果如此不同?在此先感谢