问题标签 [tidymodels]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
235 浏览

r - 在 Parsnip 中使用偏移量配置 XGBoost 泊松回归

我正在尝试使用parsnip指定一个配方来拟合具有对数偏移的 xgboost 泊松回归模型。要设置泊松回归,我可以在 中指定一个选项set_engine,效果很好:

查看 xgboost 的文档和此处的示例,似乎建议使用以下方法指定偏移量:

我不确定如何将其包含在set_engine上面。具体来说,我不确定如何与xgtraindataframe关联training_df

0 投票
1 回答
2029 浏览

r - Tidymodels tune_grid:不使用公式时“不能对不存在的列进行子集化”

我已经为 TidyTuesday 上最近的咖啡数据集整理了一个数据预处理方法。我的意图是生成一个工作流,然后从那里调整一个超参数。我特别感兴趣的是通过各种update_role()函数手动声明预测变量和结果,而不是使用公式,因为我对这种类型的变量选择有一些很好的计划(这真是个好主意!)。

prep下面的示例生成了一个与and配合得很好的配方bake(coffee_test)。如果我取消选择结果列,它甚至可以工作,例如。coffee_recipe %>% bake(select(coffee_test, -cupper_points)). 但是,当我运行工作流程时,tune_grid我会得到如图所示的错误。看起来tune_grid找不到没有“预测器”角色的变量,即使bake做得很好。

现在,如果我改为使用公式和step_rm我不关心的变量以正常方式做事,那么事情大多会起作用——我会收到一些关于缺少country_of_origin值的行的警告,我觉得这很奇怪,因为我应该插补那些。我完全有可能误解了角色的目的以及如何使用它们。

reprex 包(v0.3.0)于 2020 年 7 月 21 日创建

会话信息
0 投票
1 回答
73 浏览

tidymodels - 将 initial_time_split 与 drake 一起使用时出错

学习如何将 drake 与 tidymodels 一起使用。

当我运行 make(plan) 时,关于使用 rsample 的 initial_time_split() 而不仅仅是 initial_split() 的一些事情给了我一个错误。我得到以下信息:

真的一直在为此绞尽脑汁。该功能可以正常工作,独立(即以下工作): 在此处输入图像描述

我觉得我错过了一些非常基本的东西。

这是单个文件中的完整 drake 进程(以便更容易在堆栈溢出时发布)。

提前感谢您的提示,关于我做错了什么。

0 投票
1 回答
175 浏览

r - 使用嵌套重采样使用 tidymodel 调整岭回归

我想使用tidymodels. 我看过这个嵌套采样教程,但不知道如何将调整从一个增加到两个超参数。请看下面的例子:

示例数据:

设置内折和外折:

拟合模型并计算 RMSE 的函数:

但是调整两个超参数的功能不起作用:

提前致谢。

0 投票
1 回答
1543 浏览

r - 如何提取 Tidymodels 产生的 GLMNET 系数

我使用tidymodels估计了一个glmnet逻辑回归。但我无法在tidymodels中找出两个密切相关的东西:

  • a) 如何提取估计系数
  • b) 保存估计的模型以供将来生产使用。

以下是伪模型的代码。我试过tidy(), coef()predict()但都失败了。任何帮助都感激不尽。谢谢。

reprex 包(v0.3.0)于 2020 年 7 月 25 日创建

0 投票
1 回答
215 浏览

r - 如何使用 Tidymodels 中的更新功能更新调整参数值

我尝试使用updatein 中的函数覆盖默认调整值tidymodels,但值无法更新。

例如,在下面的代码中,我想将 的范围min_n从默认的 2 到 40 更改为 30 到 50。但是,值min_n保持在 2 和 40。

reprex 包(v0.3.0)于 2020-07-26 创建

0 投票
1 回答
204 浏览

r - tidymodels 堆栈可以覆盖具有不同特征和缺失值的模型吗?

我试过运行这个 tidymodels 工作流程,看看我是否可以组合两个具有不同特征和缺失值的模型。能够结合不同的数据源来对相同的结果进行建模对于现实世界的数据来说非常方便,只是不确定它是否可能与 tidymodels 堆栈一起使用。这个工作流程是否有明显的问题导致堆栈失败?

0 投票
1 回答
385 浏览

r - 如何使用 tidymodels 在我的结果变量中设置哪个级别是“事件”?

我正在使用进行机器学习,并且我想预测二进制响应/结果。如何指定结果的哪个级别是“事件”或正面案例?

这发生在食谱中还是其他地方?

0 投票
1 回答
1709 浏览

r - 预处理数据后如何在 tidymodels R 中进行预测

嗨,我正在尝试使用 tidymodels 制作线性回归模型的示例,我设法使用框架正确拟合模型,并使用 collect_metrics() 和 collect_predictions() 在工作流中对其进行测试。但是,当我尝试使用该模型对新数据进行预测时,我无法让它发挥作用。我正在尝试调整这个例子

这就是我正在做的事情:

到这里一切似乎都正常,当我尝试使用预测功能时出现错误

我试过这个:

和这个:

任何帮助都会非常感激

0 投票
1 回答
36 浏览

r - R 错误中的 Shapley IML。col 错误是什么意思?

我有以下框架用于将随机森林拟合到我的数据集

在我的数据集上运行 SHAPLEY 时出现以下错误。

有谁知道我为什么会收到这个错误?

我使用的数据集data_num