问题标签 [quantile]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R使用quantreg分位数回归包返回零/空系数
我正在使用该quantreg
包计算 R 中的分位数回归。我使用以下命令调用我的 QR。
现在,如果我查看返回值,变量 flightHours 和 flightHoursType 的系数为零/NULL。
添加时se = "nid"
,我还会收到一条警告消息:
警告信息:在summary.rq(quantGsReg15, se = "nid") : 7 non-positive fis
我之前计算的 OLS 回归表明情况很可能并非如此。我尝试了不同的 QR 方法(method = "fn")但没有成功。
对 0.5 分位数调用相同的命令会返回类似的输出。但是,我收到一条不同的警告消息:
警告消息:在 rq.fit.br(x, y, tau = tau, ci = TRUE, ...) 中:解决方案可能不唯一
我究竟做错了什么?我现在用谷歌搜索了 30 分钟,但没有成功。
r - R中的分位数回归分析
我注意到,每当我尝试使用正常 OLS 系数及其 CI 绘制系数图及其置信区间 (CI) 时,每当我强制回归原点时都会出现错误。
因此,如果我使用此代码(engel 是 R 中分位数回归示例的数据):
我没有问题,我的 coefficeint 图被绘制出来了。但如果我使用这个:
我有一个问题,因为拦截经过原点。如何在没有截距的情况下获得分位数回归的第一个代码中的图。
cluster-computing - 从网络日志中评分类别
我正在为网站上的类别的个人评分构建评分器。
输入:用户 ID、类别
输出:用户 ID、score_cat_1、score_cat_2 等...
分数在 10 上给出。
我的计划是首先为每个用户计算每个类别的点击次数,然后将结果划分为分位数(可能是一千个),最后对每个类别的分位数使用聚类算法将它们聚类为 10 个聚类,将排序,并给出率。
这个想法是将靠近的分位数分组在同一个集群中,并获得更有趣的分数,而不是仅仅说“10% 最好的点击者得到 10,接下来的 10% 得到 9,等等......
我的问题如下:
1-你认为这是个好主意吗?有没有更自然、更准确的方法呢?
2-集群可能太小,我不能保证每个集群上的基数。
r - 线性分位数混合模型 [R] lqmm - 包:f(arg, ...) 中的错误:外部函数调用中的 NA/NaN/Inf (arg 1)
我想计算线性分位数混合模型,但总是出现以下错误
要重现,请下载数据集并导入:
https://dl.dropboxusercontent.com/u/79415744/mixedModelDataSet.txt
然后尝试计算模型:
我做错了什么?
计算非分位数混合模型有效:
非常感谢你的帮助!
最好的,弗洛里安
sql - Postgresql:获取百分位数并计算每个图块中有多少
我生成了以下结果集
以上结果集是从以下查询生成的:
现在我要做的是计算百分位数:
我不确定上面的哪一列更有意义,但假设我想使用 degree_easy 和 degree_hard 来计算百分位数或至少其中一个 如何ntile
在 postgres 中使用函数来做到这一点?
执行以下操作的最佳做法是什么:
r - 高阶分位数
给定 R 中的一个简单数据集,我需要找出它的第 40 个分位数。如何才能做到这一点?
提前致谢!
python - 改进代码以用 pandas DataFrame 中的中值本身替换中值以上的值
我想用列本身的中值替换列中值以上的所有值。
这是我的数据框:
这是我的解决方案:
我不熟悉数据框,所以我想知道是否有可能以更“熊猫”的方式或使用一些花哨的线性代数来做到这一点。
预先感谢您的回复。
编辑答案:
以下是分别来自 hurrial 和 chrisb 的解决方案的快速时间:
使用 np.minimum 的解决方案似乎更快。
谢谢我今天学到了 2 个强大的东西, np.where 和 np.minimum !
hadoop - Apache Pig 分位数分组
我正在努力为 Pig 的分组问题找到一些解决方案。目前我有一个看起来像的数据集;
我正在使用 DataFu 库中的 StreamingQuantile 方法来计算高度变量的分位数(第 25、第 50 ... 蚀刻)。目前它有效,但我还需要计算每个组的 AVG 权重 + 它们的分位数;所以它看起来像这样;
作为参考,这里是用于计算分位数的简单 Pig;
无论如何我也可以计算每个分位数和组的平均值 2 美元吗?
c++ - Explain a snippet of c++ codes
I just started learning "class" and other advanced techniques in C++ in order to understand the following C++ snippet. Please don't down rate the question if you think it's silly because I've searched online before asking!
The code implements an online quantile algorithm called 'GK method'. I try to understand the practical work flow of the algorithm by learning the code. The full code has 191 lines so I didn't copy it here, it is located at: https://github.com/coolwanglu/quantile-alg/blob/master/gk.h
The part of the code I don't understand is list below:
I don't understand what #48,49 means.
Here what does "Type & Name" mean?
Finally, if anyone who's familar with GK method happen to see this: Could you explain to me, or suggest any references that explain the practical implementation of this method. Thanks.
javascript - d3 分位数或四分位数刻度给定的四分位数值
当前分位数尺度以所有输入值作为域来映射输出范围。但是如果数据非常大,我希望在服务器上进行处理,给我四分位数的值。
所以我得到:
var quartiles=[5, 10, 15, 20, 25, 30, 35, 40, 45]; // 9 values with the mean (25) at the middle and standard deviations to each side
var valueToMark = 37;
使用 d3,我如何正确创建分位数比例并将它们全部标记在一条线上,只给定分位数和要标记的值?
ps 我对分位数/四分位数的了解是有限的,因此如果我也能纠正我在这里展示的任何错误假设,我将不胜感激。