“percentile”的相关标签问题

0 投票

1 回答

576 浏览

sql - 查询 sql server 2005 以获得不同组的第 95 个百分位

我有一张像下面描述的虚拟表一样的表

日期 || 服务器 || 数数

1200 || 乙 || 123

1200 || C || 124

1200 || 乙 || 125

1300 || 乙 || 126

1300 || C || 127

1300 || 乙 || 128

1300 || C || 129

我需要编写一个查询来创建一个表，以便获得按日期和服务器分组的 Count 的 95%。

我对Sql没有太多经验，看了google搜索结果，浏览了无数链接，看到使用了很多子查询，我有点害怕。没有人能给出简单的查询。我们不能直接使用直接查询得到如下结果吗？

日期 || 服务器 || 数数

1200 || 乙 || 123

1200 || C || 124

1300 || 乙 || 126

1300 || C || 127

有人可以提供可以使用的确切查询吗？

谢谢您的帮助！！

2012-06-05T10:31:15.817

0 投票

2 回答

1480 浏览

python - 使用 Python 匹配 Stata 加权 xtile 命令的确定方法？

对于一个项目，我需要复制当前存在于 Stata 输出文件 (.dta) 中的一些结果，这些结果是从较旧的 Stata 脚本中计算出来的。项目的新版本需要用 Python 编写。

我遇到困难的具体部分是根据 Stataxtile命令的加权版本匹配分位数断点计算。请注意，数据点之间的联系与权重无关，并且我使用的权重来自连续数量，因此联系极不可能（并且我的测试数据集中没有联系）。因此，不是因为联系而导致分类错误。

我已经阅读了关于加权百分位数的 Wikipedia 文章以及这篇交叉验证的文章，该文章描述了一种替代算法，该算法应该复制 R 的 type-7 分位数。

我已经实现了这两种加权算法（底部的代码），但我仍然不能很好地与 Stata 输出中的计算分位数匹配。

有谁知道Stata例程使用的具体算法？文档没有清楚地描述这一点。它说的是在 CDF 的平坦部分取平均值来反转它，但这几乎没有描述实际的算法，并且对于它是否在做任何其他插值也模棱两可。

请注意，numpy.percentile并且scipy.stats.mstats.mquantiles不接受权重，也不能执行加权分位数，只是常规的等权分位数。我的问题的症结在于需要使用权重。

注意：我已经对以下两种方法进行了很多调试，但是如果您看到一个错误，请随时在评论中提出错误建议。我已经在较小的数据集上测试了这两种方法，结果很好，并且在我可以保证 R 使用什么方法的情况下也匹配 R 的输出。代码还不是很优雅，两种类型之间复制了太多，但是当我相信输出是我需要的时，所有这些都会在以后修复。

问题是我不知道Stataxtile使用的方法，我想减少下面的代码和Stataxtile在同一数据集上运行时的不匹配。

我尝试过的算法：

python numpy stata percentile

2012-07-20T19:10:28.830

0 投票

5 回答

54788 浏览

python - matplotlib：绘图时忽略异常值

我正在绘制来自各种测试的一些数据。有时在测试中我碰巧有一个异常值（比如 0.1），而所有其他值都小三个数量级。

使用 matplotlib，我针对范围进行绘图[0, max_data_value]

我怎样才能放大我的数据而不显示异常值，这会弄乱我的绘图中的 x 轴？

我是否应该简单地取 95 个百分位数并[0, 95_percentile] 在 x 轴上有范围？

python plot matplotlib percentile outliers

2012-08-09T11:28:33.003

0 投票

2 回答

1004 浏览

r - For-loop error and min 2.5% and max 97.5% percentile in R

I have a data set with 41 rows and 21 columns. In DF, each row represents energy data in 15 minute interval of the day (from 10am-8pm). each column represents selected days within a month month.

I need to figure out load variability (standard deviation/ mean) b/w two lines in each column using the following equation.

I.e, between the 1st and 2nd; 1st, 2nd and 3rd; 1st-4th; 1st-5th; etc. element of each column.

I keep getting NA values in "lv" and wonder why. The end result, lv should have a dataframe of 41x21, same as df but with load variability.

Also, how do I also get 2.5 and 97.5 percentiles within the loop other than load variability?

lv ends up with null values (NA).

r for-loop percentile

2012-08-14T13:02:39.167

0 投票

2 回答

7756 浏览

php - 在php中使用数组查找百分位数

我有一个这样的数组

这里 index 是userid，value 是他的分数。

现在我想要为用户实现百分位数，例如 45,48 的百分位数为 99，42,40,34 为 97，41 为 94。

我怎样才能做到这一点？

php arrays arraylist percentile

2012-08-23T10:51:45.840

0 投票

2 回答

1288 浏览

highcharts - 计算高图中 yAxis 的第 85 个百分位数

我有一个包含多个系列的图表，我有一个将 yAxis 重置为特定数量的按钮。我想将此特定数量设置为 yAxis 值的第 85 个百分位。有没有办法计算这个？jsfiddle 示例：http: //jsfiddle.net/inadcod/TynwP/

highcharts percentile

2012-09-05T14:12:03.113

0 投票

10 回答

47271 浏览

python - 将每个列表值映射到其相应的百分位数

我想创建一个函数，它将（排序的）列表作为其参数，并输出一个包含每个元素对应百分位数的列表。

例如，fn([1,2,3,4,17])返回[0.0, 0.25, 0.50, 0.75, 1.00].

任何人都可以请：

帮我更正下面的代码？或者
提供比我的代码更好的替代方法来将列表中的值映射到相应的百分位数？

我当前的代码：

目前，如果我提交percentile([1,2,3,4,17])，[0.0, 0.0, 0.5, 0.0, 1.0]则返回列表。

python numpy scipy median percentile

2012-09-13T20:10:37.137

0 投票

3 回答

2915 浏览

java - 一组数据的百分位数可以用map-reduce的方式计算吗？

我的理解是计算百分位数，数据需要排序。如果大量数据分布在多个服务器上，而无需移动，这是否可行？

java statistics mapreduce percentile

2012-09-16T02:53:04.910

0 投票

1 回答

7742 浏览

我对 R 很陌生，最近用它来制作一些箱线图。我还在箱线图中添加了平均值和标准差。我想知道我是否也可以在不同的百分位数中添加某种刻度线或圆圈。假设我想在每个 HOUR 箱形图中标记第 85、第 90 个百分位数，有没有办法做到这一点？我的数据包含一年中每小时 MW 的负载，我的输出包含每个月每小时的 24 个箱线图。我每个月一次做一次，因为我不确定是否有办法一次运行所有 96 个（每个月，工作日/周末，4 个不同区域）箱线图。提前感谢您的帮助。

r boxplot ggplot2 percentile

2012-09-17T15:31:03.427

0 投票

1 回答

285 浏览

mysql - MySQL VIEW 列作为其他 3 个 VIEW 列的组合排名

忍受我，我是 SQL.stupid。我终于了解到应该尽可能使用视图而不是 crons。现在，我在视图问题中有一个视图。

我的堆栈朋友让我走到了这一步：

我想将第 5 列放入与其他 3 列同等加权的视图中。

因此，方程类似于 (1/3)*percentile(column1Sum) + (1/3)*percentile(column2Sum) + (1/3)*percentile(column3Sum) 其中“percentile()”是百分位数列与列的其余部分。

请原谅缺乏清晰度。这真的不是我的专长。将根据需要进行编辑。

非常感谢您提前！

百分位清晰度

就我而言，百分位数是针对重复调整的给定列的从最高到最低的百分比排名。因此，对于具有 100 个值的列，具有最大值的列将是 100%，具有最低值的列将是 0%（或者是 1%？）。如果有 100 个但 50 个重复项，则底部的两个将分享 2%。

mysql view percentile

user1382306

2012-10-06T21:00:06.717

问题标签 [percentile]

sql - 查询 sql server 2005 以获得不同组的第 95 个百分位

日期 || 服务器 || 数数

1200 || 乙 || 123

1200 || C || 124

1200 || 乙 || 125

1300 || 乙 || 126

1300 || C || 127

1300 || 乙 || 128

1300 || C || 129

日期 || 服务器 || 数数

1200 || 乙 || 123

1200 || C || 124

1300 || 乙 || 126

1300 || C || 127

python - 使用 Python 匹配 Stata 加权 xtile 命令的确定方法？

python - matplotlib：绘图时忽略异常值

r - For-loop error and min 2.5% and max 97.5% percentile in R

php - 在php中使用数组查找百分位数

highcharts - 计算高图中 yAxis 的第 85 个百分位数

python - 将每个列表值映射到其相应的百分位数

java - 一组数据的百分位数可以用map-reduce的方式计算吗？

r - 在 R 的箱线图中添加不同的百分位数

mysql - MySQL VIEW 列作为其他 3 个 VIEW 列的组合排名

问题标签 [percentile]

日期 || 服务器 || 数数

1200 || 乙 || 123

1200 || C || 124

1200 || 乙 || 125

1300 || 乙 || 126

1300 || C || 127

1300 || 乙 || 128

1300 || C || 129

日期 || 服务器 || 数数

1200 || 乙 || 123

1200 || C || 124

1300 || 乙 || 126

1300 || C || 127

Reference