问题标签 [quantile-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 自变量指数和的分位数回归
我想根据一些谐波对我的数据(时间序列)进行分位数回归。这是为了消除分位数的时间变异性。
谐波很简单:
最直接的公式是:
由此modqr
我将模型拟合为:
res
将有 5 个系数、一个截距和 4 个谐波系数。
但是,我需要我的 y 是非负的,所以一个简单的转换可能是这样的:
它是y
谐波和的指数的函数。
但是,如果我使用这个公式,结果将只有 2 个参数,当然,一个用于截距,一个用于术语np.exp(h1+h2+h3+h4)
,它被视为一个唯一的自变量。
问:有没有办法写这个公式来欺骗 quantreg 来评估我的谐波和的指数,因此仍然给我 5 个参数?
我认为我可以通过类似于family=Poisson()
当我拟合泊松回归时通过 kwargs 的方式传递我的自变量公式的转换,但我不确定如何。
r - 计算 R 中区间预测的区间分数
在 stackexchange 的线程中:“forecast-accuracy-metric-that-involves-prediction-intervals”有关更多详细信息,请参阅显示预测间隔质量度量的链接。
我想在 R 中计算质量度量:
通过使用产品:
目标
可以计算区间质量度量。我想找到一个用于区间预测评估的实现库。
另一种解决方案可以是计算“预测区间的覆盖范围和长度”或任何其他评估指标。
对此实施有任何帮助吗?
python - 具有多个自变量的分位数回归?
是否可以使用多个自变量 (x) 运行分位数回归。使用 Python 我尝试了 statsmodel
其中 y 和 X 是 Pandas 数据帧。这适用于 OLS,但对于分位数回归我不适用。
您将如何执行此操作?
python - 分位数回归预测
我使用statsmodels.formula.api.quantreg在测试集上进行预测。运行此方法时出现意外错误:
有趣的是,在训练集上运行了相同的预测,而且效果非常好!下面是训练部分的代码:
r - RMarkdown 中的分位数回归汇总表
我想用 stargazer 创建一个分位数回归结果表。结果应该是这样的
所以到目前为止我所做的如下:首先拟合数据并为标准错误调用一些摘要函数。提取系数值每个分位数的相应 p_val 并将所有内容收集在一个小标题中。看起来像这样:
我对观星者很陌生,但认为必须有办法做到这一点。任何帮助,将不胜感激。我已经完成了这个小插曲,但没有想出比以下更好的东西:
这会产生以下错误:Error in if (substr(inside[i], 1, nchar("list(")) == "list(") { : missing value where TRUE/FALSE needed
编辑:我知道结果如何。可怕,当然。但请不要介意这一点。这是一个已知问题,不应成为此讨论的一部分。
r - 固定效应分位数回归 (rqpd) 是否可能超过固定效应的类型?
我试图估计 GDP(以立方计算)对二氧化碳排放的影响。为了估计 CO2 排放分布的影响,我想进行分位数回归。为了减少遗漏变量偏差,我想包括国家固定效应和十年固定效应。我使用 Koenker 和 Bach 提供的 rqpd 包,特别是 Penalized Fixed Effects (PFE) 方法。
数据由 3247 个观测值组成。代码如下:
这会产生错误消息:Error in `[[<-.data.frame`(`*tmp*`, i, value = c(18L, 18L, 18L, 18L, 18L, : replacement has 6494 rows, data has 3247
如果我只包括 Country 固定效果,则代码有效。因此,我的问题是:是否可以在 rqpd 中包含不止一种类型的固定效应?或者有没有其他选择来估计分位数回归中的固定效应?我检查了“lqmm”和“quantreg”包,但找不到任何相关的东西。非常感谢您的任何建议!
python - 带有 Tensorflow 概率的分位数回归
我正在尝试尝试 tensorflow 概率。我在 R 中有一个简单的分位数回归。我想从张量流概率中得到相同的结果。
R分位数回归
上面的输出是每个值的 9 个分位数预测
TensorFlow 概率尝试
这里的输出是:
我仍在学习 TFP,所以我确信我在模型规范中犯了一些简单的错误,但目前我还不清楚那个错误是什么。
r - R中的网格搜索用于非参数分位数回归
我在 R 中使用了一个名为“quantreg”的库,并尝试在时间序列的基础上估计完整的非参数分位数回归。为了获得统计上显着的结果,我尝试了很多变量和平滑参数值 (lambda)。但这很累而且非常耗时。因此,我想应用网格搜索,但这对我来说有点难。我想确定最佳平滑值,所以我应该构造一个 for 循环。但我希望该循环尝试每种组合。在我想获得最佳模型或模型的 lambda 值(所有变量的 p 值<0.05 条件)。例如,如果我的方程式中有三个变量,我会这样写:
如何重新排列此代码?有什么捷径吗?
任何帮助将不胜感激。先感谢您。
python - 如何找出分位数回归中不同分位数的系数是否显着不同?(SPSS 或 Python)
我正在研究某个职业的收入增长率在收入分配的不同部分是否存在显着差异,以查看收入差距是否在显着扩大或缩小。
QUANTREG 模型
我在 SPSS 中执行了分位数回归(我是编码新手,只有 Python 的基本知识,所以我需要你的帮助)。因变量是指数收入,自变量是时间(该数据集中的季度)、人口统计组、专业领域。我还添加了每个虚拟人的交互项和时间变量。
所以(至少在我看来),这个模型允许在三个层次上比较收入的变化:
- 属于某个人口群体或细分市场如何影响收入(例如,与数据输入工作相比:数据分析增加 100 欧元,数据科学增加 200 欧元)
- 每个不同类别/虚拟对象的影响如何随时间变化(例如,与数据输入工作相比,成为数据科学家的积极影响增加了 10%,现在增加了 220 欧元)
- 这些变化的影响在收入分配的不同部分之间有何不同(例如,time*data_scientist 的系数在 90%Q 中比在 10%Q 中大得多,表明收入较高的数据科学家看到了更大的增长随着时间的推移,收入低于收入较低的数据科学家)
问题
所以我在 SPSS 上得到了这个分位数回归的输出,这是一个包含所有系数及其显着性和置信区间的巨大表格。
现在我想弄清楚90%Q和10%Q之间的差异在统计上是否显着,以便说明这个行业的收入差距是显着增加还是减少。我想在 Python 而不是 SPSS 上执行此操作,我搜索了如何将数据切割成分位数,以及如何执行分位数回归。但是应该如何测试 90%Q 和 10%Q 之间差异的显着性呢?