问题标签 [quantile-regression]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
38 浏览

random-forest - 在分位数随机森林回归模型中检查树木

我有兴趣训练一个随机森林来学习一些从某个分布独立采样的数据 {X, y} 的条件分位数。

也就是说,对于一些 $$\alpha \in (0, 1)$$,一个映射 $$\hat{q} {\alpha}(x) \in [0, 1]$$ 使得对于每个 $X $, $$argmin {\hat{q} {\alpha} P(y < \hat{q} \alpha(x)) > \alpha$$。

有没有什么明确的方法可以在 python 中有效地构建一个随机森林来产生这样的模型?

此外,我还有一个附加要求,虽然我不确定,但目前的库可能是可能的。要求:我想从我的训练集中选择一个点子集 A,并在我进行预测时从我的随机森林中选择并排除那些用 A 中的点训练的树。

0 投票
2 回答
334 浏览

r - rqpd 的分位数回归摘要不返回标准误差

我在 R 中使用 rqpd 包进行具有固定效果的分位数回归(quantreg 包不支持具有固定效果的分位数回归),如下所示:

summary(reg_q1)$coefficients用来获取系数和标准误差。一年前它工作得很好,但一年后我回到了我的代码,摘要函数只返回一个像这样的字符:

你知道我怎么能从中得到标准错误吗?软件包最近在输出方面是否发生了变化?

0 投票
0 回答
108 浏览

python - 分位数回归中梯度提升和神经网络的超参数调整

我正在使用 Sklearns GradientBoostingRegressor 进行分位数回归以及在 Keras 中实现的非线性神经网络。但是我不知道如何找到超参数。

对于 GradientBoostingRegressor,为每个分位数拟合一个单独的回归。我是否为每个分位数找到了一组新的超参数,或者我是否为每个分位数拟合了相同的超参数集?

对于 Keras,我如何决定超参数作为我实现模型的方式,它同时预测所有分位数。下面是我在 Keras 中的实现示例:

0 投票
0 回答
79 浏览

python - Statsmodels QuantReg 只会使用一定数量的特征进行训练

我正在使用 statsmodels 来训练线性分位数回归。我有不同的功能组合需要尝试和训练,但好像 statsmodels 只允许模型中包含一定数量的功能。我在下面附上了一个虚拟示例。

这里mod1运行没有问题,但mod2给了我错误: ValueError: operands could not be broadcast together with shapes (15,) (10,) 。所以好像 statsmodels 记住了以前模型的特征数量?

0 投票
0 回答
134 浏览

python - 用于分位数回归的 sklearn RandomizedSearchCV 的自定义损失函数

我正在使用 sklearns 梯度增强回归器通过将损失指定为quantile. 在进行 RandomizedSearchCV 时,要找到最佳超参数,这不是一个选项。因此,我认为我需要构建自己的丢失功能,但到目前为止我还没有成功。

以下是我迄今为止构建自己的损失函数的最佳选择。我正在使用 sklearn make_scorer

下面我训练我的模型:

这确实运行但似乎做得不太好。第 25、50、75 和 95 分位数的预测分位数值完全相同。是有错误还是我的数据很奇怪?

0 投票
0 回答
34 浏览

r - 提取 R 中所有分位数回归解决方案的斜率值

我想知道当我执行以下操作时如何获得所有已安装模型的斜率:

-1tau 作为 tau 的论点,可以为您提供我所理解的所有分位数回归解决方案。绘图z带有以下绘图:

在此处输入图像描述

现在我想知道如何为所有分位数回归解决方案提取斜率(正确的图)。tau我可以像这样访问的值:

0 投票
0 回答
70 浏览

r - R:寻找 Machado 和 Silva(2019)固定效应的分位数回归的实现

我正在寻找 Machado 和 Santos Silva (2019) 提出的具有固定效应的分位数回归的 R 实现。

它是否包含在任何软件包中,或者是否有人目前正​​在研究它?

我知道作者在 Stata 中实现了他们的方法(参见https://jmcss.som.surrey.ac.uk/research.htmlxtqreg)。但是,我找不到 R 的等效函数。

欢迎任何帮助!

参考: Machado, JAF 和 Santos Silva, JMC (2019), Quantiles via Moments, Journal of Econometrics , 213(1), pp. 145-173。

0 投票
0 回答
21 浏览

audio - 如何递归地计算 p 分位数?

在这篇论文“A Technique with Low Memory and Computational Requirements for Dynamic Tracking of Quantiles ( https://doi.org/10.1007/s11265-017-1327-6 )”中,他们说:

Δ+ 和 Δ− 的值应该使得分位数估计收敛到样本分位数并且增量之和接近零,即 ∑d(n) ≈ 0。

我不明白为什么我们需要确保 ∑d(n) ≈ 0 ?有人可以给出解释之类的教程吗?

在此处输入图像描述

0 投票
0 回答
29 浏览

javascript - JavaScript 中的分位数回归

我来自R环境。quantreg在那里使用包和使用分位数回归非常容易。

JavaScript 中是否有任何类似的简单方法来获取一些数据并拟合条件分位数?

0 投票
0 回答
114 浏览

python - 训练最后一棵树时,来自 scikit-garden .fit 方法的 RandomForestQuantileRegressor 冻结

我已经使用 scikit-garden 大约 2 个月了,尝试训练分位数回归森林 (QRF),类似于本文中的方法。该论文的作者使用了 R,但因为我和我的同事已经熟悉 python,所以我们决定使用 scikit-garden 的 QRF 实现。首先,这个包的形状很糟糕,而且似乎没有完全发挥作用(我们必须首先更改一些源代码才能让它运行)。这是我让它发挥作用的最后一次尝试。

完成负责创建可用数据集的所有代码后,我们现在尝试使用标准超参数训练一个简单的 QRF,以获得对错误的初步估计。到目前为止,没有一次训练完成,因为在训练最后一棵树时它似乎总是停止/冻结,我总是不得不自己杀死这项工作以避免惹恼系统管理员。

例如,我在 8 个 CPU 上进行的最新训练运行(每个 CPU 训练 1 棵树),标准设置构建并训练 10 棵树。所有的树都在 5 到 6 分钟内建成并训练完毕,除了最后一棵树,我让它跑了一周,然后才被迫杀死它。重要的是,保留的 8 个 CPU 中只有一个处于活动状态,并且(显然)以 100% 的速度运行。

我们有相当大的数据集(约 2'000'000 个观测值),但即使有较小的摘录,它仍然会冻结在最后一棵树上。除了最后一棵树之外,所有树都应该在完整数据集上快速训练,这对我来说也没什么意义。

以下是主要训练代码的一小段摘录:

这是我第一次在这里发布问题 - 如果我忘记了任何重要信息,请告诉我!非常感谢任何可以帮助我的人!:)