问题标签 [tweedie]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regression - ligthgbm tweedie 参数
我正在使用lightgbm 包tweedie
的参数选项。objective
根据wikipedia,tweedie 分布有一个自由参数p,但我似乎找不到给它一个值的方法。
有谁知道该怎么做?默认值是多少?
statistics - H2O 中的平均残差公式
我试图找出 H2O 中用于 Tweedie 分布的平均残差损失函数的确切公式。
或者,一般来说,Tweedie 分布因变量的平均残差是多少?
到目前为止,我找到了这个页面(http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/glm.html#tweedie-models)其中tweedie分布的偏差公式给出为:
但是,在 H2O 代码中,可在此页面第 103 行的 github 上找到(https://github.com/h2oai/h2o-3/blob/master/h2o-core/src/main/java/hex/Distribution.java# L103)公式的指定方式不同(忽略欧米茄,它只是权重,并且缺少求和):
方程形式为:
那么,是文档错误还是实施错误?我将不胜感激任何帮助!
谢谢!
r - 使用带有日志链接的 tweedie 分发时 glm.fit 出错
在使用 tweedie 和日志链接在 R 中运行glm
时,我遇到了
“glm.fit 中的错误 ... x 中的 NA/NAN/INF”
我尝试过使用不同的发行版和链接。我还尝试在响应中添加 1,因为它是包含很多 0 的保险数据。
我已经检查了 na's、nan's 和 inf 值,但我的数据集中没有(或者已经更正了它们)。
这是我的代码:
python-3.x - lightGBM 中的 Tweedie 偏差损失函数
我正在使用带有 lightGBM 的 Tweedie 目标函数并且有一些问题:
- lightGBM 用于 Tweedie 的损失函数是什么?
- 它如何处理值为 0 的预测,因为 sklearn 中的 mean_tweedie_deviance 断言严格肯定的事实和预测?
- mean_tweedie_deviance 是损失吗?
我查看了源代码,似乎损失只是偏差的两个术语。
有没有人有过使用 tweedie loss 进行超参数调整的经验?
r - 从另一个包中调用时,无法从 mgcv 访问“ldTweedie”函数
我在自己的包中使用 mgcv 包,到目前为止一切正常。但是,我尝试将 Tweedie 系列对象(“Tweedie()”、“tw()”)引入我的包,但在尝试使用后者时出现错误。
函数就这么简单(这里简化了):
我在 NAMESPACE 文件中有这个
因此,在安装包后,我调用了我的函数(未导出,它通常在我的包中的其他函数中使用)
然后我尝试添加:
安装了软件包并遇到了同样的问题。但是,如果我使用 devtools 加载我的包:
一切正常。所以我想知道我在这里做错了什么,或者我怎样才能通过安装而不必使用 load_all() 来让我的包/功能工作?谢谢
python - 在 colab 中运行 statsmodel 时出错“estimate_tweedie_power() 缺少 1 个必需的位置参数:‘mu’”
在 Google Colab 的 statsmodels 中建模 Tweedie 分布,但在尝试使用estimate_tweedie_power
函数时出现错误。这是我笔记本上的代码。
这是我在运行estimate_tweedie_power
函数时的错误。
estimate_tweedie_power() 缺少 1 个必需的位置参数:'mu'
r - XGBoost 中的 tweedie nloglike 与实际的 nloglike 有何关系?
查看 XGBoost 如何计算 tweedie 评估指标 (tweedie-nloglik) 的代码时,我们可以看到它的计算方式如下:
资料来源:以下第 310-313 行: https ://github.com/dmlc/xgboost/blob/master/src/metric/elementwise_metric.cu
对于 1-2 之间的 p 值,该表达式确实显示出与粗花呢偏差表达式的相似性,但似乎没有精确的映射。根据维基百科的 Tweedie 偏差:
如果我删除常量并从 Wikipedia 获取表达式的负对数,我最终不会得到 XGBoost 中等于 -a + b 的表达式。那么我的问题是 XGBoost 计算的值是什么以及它与负对数似然的关系如何?
谢谢!
r - Xgboost tweedie:为什么从链接 = exp(link)/ 2 获得预测的公式是?
这是一个有点小众的问题,但我真的不明白。
当我运行 Tweedie GLM 时,可以通过执行 exp(link) 从链接中获取预测。为了获得 Tweedie GLM 的预测,我通过执行 exp(link)/2 从链接获得预测。我不明白为什么我需要除以 2。
下面的最小可重复示例,灵感来自https://github.com/dmlc/xgboost/blob/master/R-package/demo/tweedie_regression.R上的 tweedie 回归演示
r - R如何评估glm中的单个输入变量系数
我有一个 R glm 对象,我想评估与新数据帧的单个输入变量相关联的系数。这是一个例子:
我想提取与 X = 'f' 相关的系数(应该是基础级别,0)。我想提取与 W = 5 相关的系数(应该是 log(5) * beta)
谢谢,
约翰
r - 您如何在 JAGS/BUGS 中编写 Tweedie 发行版?
我想通过 R 使用 JAGS 在 Tweedie 分布变量上运行模型。我知道 JAGS 没有标准的 Tweedie 分布,但可以将其指定为复合 Gamma/Poisson。不幸的是,我无法弄清楚如何在 JAGS 中对其进行编码。我根据从各种来源收集的代码编写了以下代码,以简单地尝试从 Tweedie 随机变量中恢复均值、功率和 phi 参数。它目前没有运行,因为 y 上的父值无效,大概是因为 y[i] 出现在表达式的右侧和左侧。这是在源代码中编写的,但我显然在滥用它。任何有关如何正确指定此分布的指针都将不胜感激,并且可能像我一样得到更广泛的使用