“quantile”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

1049 浏览

r - R使用quantreg分位数回归包返回零/空系数

我正在使用该quantreg包计算 R 中的分位数回归。我使用以下命令调用我的 QR。

现在，如果我查看返回值，变量 flightHours 和 flightHoursType 的系数为零/NULL。

添加时se = "nid"，我还会收到一条警告消息：

警告信息：在summary.rq(quantGsReg15, se = "nid") : 7 non-positive fis

我之前计算的 OLS 回归表明情况很可能并非如此。我尝试了不同的 QR 方法（method = "fn"）但没有成功。

对 0.5 分位数调用相同的命令会返回类似的输出。但是，我收到一条不同的警告消息：

警告消息：在 rq.fit.br(x, y, tau = tau, ci = TRUE, ...) 中：解决方案可能不唯一

我究竟做错了什么？我现在用谷歌搜索了 30 分钟，但没有成功。

r regression quantile quantreg

2014-08-02T09:06:07.987

0 投票

0 回答

1382 浏览

r - R中的分位数回归分析

我注意到，每当我尝试使用正常 OLS 系数及其 CI 绘制系数图及其置信区间 (CI) 时，每当我强制回归原点时都会出现错误。

因此，如果我使用此代码（engel 是 R 中分位数回归示例的数据）：

我没有问题，我的 coefficeint 图被绘制出来了。但如果我使用这个：

我有一个问题，因为拦截经过原点。如何在没有截距的情况下获得分位数回归的第一个代码中的图。

r plot regression quantile quantreg

2014-08-08T18:52:26.290

0 投票

0 回答

17 浏览

cluster-computing - 从网络日志中评分类别

我正在为网站上的类别的个人评分构建评分器。
输入：用户 ID、类别
输出：用户 ID、score_cat_1、score_cat_2 等...

分数在 10 上给出。

我的计划是首先为每个用户计算每个类别的点击次数，然后将结果划分为分位数（可能是一千个），最后对每个类别的分位数使用聚类算法将它们聚类为 10 个聚类，将排序，并给出率。
这个想法是将靠近的分位数分组在同一个集群中，并获得更有趣的分数，而不是仅仅说“10% 最好的点击者得到 10，接下来的 10% 得到 9，等等......

我的问题如下：
1-你认为这是个好主意吗？有没有更自然、更准确的方法呢？
2-集群可能太小，我不能保证每个集群上的基数。

cluster-computing scoring quantile

2014-08-12T08:10:05.767

0 投票

1 回答

1056 浏览

r - 线性分位数混合模型 [R] lqmm - 包：f(arg, ...) 中的错误：外部函数调用中的 NA/NaN/Inf (arg 1)

我想计算线性分位数混合模型，但总是出现以下错误

要重现，请下载数据集并导入：

https://dl.dropboxusercontent.com/u/79415744/mixedModelDataSet.txt

然后尝试计算模型：

我做错了什么？

计算非分位数混合模型有效：

非常感谢你的帮助！

最好的，弗洛里安

r mixed-models quantile

2014-08-16T16:47:54.840

0 投票

1 回答

1383 浏览

sql - Postgresql：获取百分位数并计算每个图块中有多少

我生成了以下结果集

以上结果集是从以下查询生成的：

现在我要做的是计算百分位数：

我不确定上面的哪一列更有意义，但假设我想使用 degree_easy 和 degree_hard 来计算百分位数或至少其中一个如何ntile在 postgres 中使用函数来做到这一点？

执行以下操作的最佳做法是什么：

sql postgresql percentile quantile

2014-08-21T18:03:22.087

0 投票

1 回答

89 浏览

r - 高阶分位数

给定 R 中的一个简单数据集，我需要找出它的第 40 个分位数。如何才能做到这一点？

提前致谢！

r math statistics quantile

2014-08-24T07:51:33.920

0 投票

2 回答

343 浏览

python - 改进代码以用 pandas DataFrame 中的中值本身替换中值以上的值

我想用列本身的中值替换列中值以上的所有值。

这是我的数据框：

这是我的解决方案：

我不熟悉数据框，所以我想知道是否有可能以更“熊猫”的方式或使用一些花哨的线性代数来做到这一点。

预先感谢您的回复。

编辑答案：

以下是分别来自 hurrial 和 chrisb 的解决方案的快速时间：

使用 np.minimum 的解决方案似乎更快。

谢谢我今天学到了 2 个强大的东西， np.where 和 np.minimum ！

python pandas normalization median quantile

2014-08-27T08:49:11.727

0 投票

1 回答

492 浏览

hadoop - Apache Pig 分位数分组

我正在努力为 Pig 的分组问题找到一些解决方案。目前我有一个看起来像的数据集；

我正在使用 DataFu 库中的 StreamingQuantile 方法来计算高度变量的分位数（第 25、第 50 ... 蚀刻）。目前它有效，但我还需要计算每个组的 AVG 权重 + 它们的分位数；所以它看起来像这样；

作为参考，这里是用于计算分位数的简单 Pig；

无论如何我也可以计算每个分位数和组的平均值 2 美元吗？

hadoop apache-pig conditional-operator quantile

2014-09-11T14:22:22.480

0 投票

1 回答

177 浏览

c++ - Explain a snippet of c++ codes

I just started learning "class" and other advanced techniques in C++ in order to understand the following C++ snippet. Please don't down rate the question if you think it's silly because I've searched online before asking!

The code implements an online quantile algorithm called 'GK method'. I try to understand the practical work flow of the algorithm by learning the code. The full code has 191 lines so I didn't copy it here, it is located at: https://github.com/coolwanglu/quantile-alg/blob/master/gk.h

The part of the code I don't understand is list below:

I don't understand what #48,49 means.

Here what does "Type & Name" mean?

Finally, if anyone who's familar with GK method happen to see this: Could you explain to me, or suggest any references that explain the practical implementation of this method. Thanks.

c++quantile

2014-09-20T01:00:42.233

0 投票

0 回答

721 浏览

javascript - d3 分位数或四分位数刻度给定的四分位数值

当前分位数尺度以所有输入值作为域来映射输出范围。但是如果数据非常大，我希望在服务器上进行处理，给我四分位数的值。

所以我得到： var quartiles=[5, 10, 15, 20, 25, 30, 35, 40, 45]; // 9 values with the mean (25) at the middle and standard deviations to each side var valueToMark = 37;

使用 d3，我如何正确创建分位数比例并将它们全部标记在一条线上，只给定分位数和要标记的值？

ps 我对分位数/四分位数的了解是有限的，因此如果我也能纠正我在这里展示的任何错误假设，我将不胜感激。

javascript d3.js statistics quantile

2014-09-22T13:14:41.950

问题标签 [quantile]

Reference