问题标签 [tidymodels]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1022 浏览

r - 如何在 tidymodels 中使用 fit() 模拟 last_fit()?

我想应用随机森林方法来预测患者在医院的等待时间。我严格按照https://www.tidymodels.org/start/case-study/上的说明调整我的模型。获得最佳模型后,我last_rf_workflow按照上面链接中的说明创建对象。

然后,我使用下面的代码来拟合最终模型:

如此处所述last_fit()函数在整个训练集上拟合模型并计算测试集的预测值。这些预测可以在 访问View(last_rf_fit[[5]][[1]])

但是,当我将模型拟合到整个训练集然后使用该predict()函数时,我得到的预测略有不同:

我想知道是否有人可以帮助我理解为什么这两个预测不同。谢谢。

0 投票
2 回答
309 浏览

r - 有没有办法在 R(或 ml3)的 recipes 包中对行(尤其是虚拟变量)进行分组

食谱步骤效果很好

但我真正想要获得的结果是下面的结果,每行有一个观察结果,因为多色项目不再需要几行。

显然,我可以这样做。但是为了将我的配方步骤完全集成到tidymodels生态系统中,例如使用工作流,如果我可以将不再需要重复的行分组,这要好得多,这要归功于配方中直接存在的虚拟变量。

是否有任何tidymodels 认可的方法来获得此结果?


我也尝试过这样做mlr3,但无济于事,因为我找不到任何适合PipeOp聚合行的方法。


我正在研究自定义step_函数或自定义PipeOp的创建,但我仍然觉得我缺少一些东西,因为我的数据类型对我来说并不罕见。

0 投票
1 回答
33 浏览

r - 如何在按行操作后保留对象类以使 int_pctl 等函数正常工作?

我试图用https://www.tidymodels.org/learn/statistics/主题上的 rowwise 函数替换 purrr::map 。我能够在前 2 个中做到这一点,但是在引导主题上,它在 int_pctl 函数处中断,因为它期望将数据作为 rset 对象。

这是我的代码:

当我与该网页上的 purrr::map 代码进行比较时,它正确生成了 boot_models 对象的 rset 类,但是我的逐行尝试没有呈现 rset 类?

在此计算期间如何保留 rset 类?或者,一般来说,假设我想使用 rowwise 函数,如何获得 int_pctl 值?

0 投票
0 回答
120 浏览

r - 如何使 tidymodels 或工作流结果与 DALEX 解释一起工作?

我想使用modelStudio,为此我需要使用DALEX::explain()将模型对象作为参数来制作解释器。我应该,但我不确定如何在这里为整个可重现的示例代码提供数据!

当我使用以下代码时

以下解释器有效:

但是当我使用整个工作流程并尝试使用 提取模型pull_workflow_fit时,它会说它无法预测。

两种情况下的类都是_xgb.Booster model_fit.

xgbtidymodels 或工作流中的哪个函数将渲染与(上面的第一个代码块)模型完全匹配的对象?

0 投票
1 回答
238 浏览

r - 如何使用从欧洲防风草函数 boost_tree 渲染的“_xgb.Booster”“model_fit”对象计算提升曲线和十分位数提升图表?

我有这段代码可以呈现“_xgb.Booster”“model_fit”对象类。我应该,但我不确定如何在这里为整个可重现的示例代码提供数据!

如何使用此 xgb 对象计算升力曲线和十分位升力图?

0 投票
1 回答
110 浏览

r - 如何在不丢失原始变量的情况下离散化数值变量?

这是我的玩具数据和代码。如何在不丢失原始变量的情况下离散化数值变量?

在上面的代码中,我从 pop 和 gdpPercap 中丢失了原始值,因为它们被各自的离散化版本替换。如何同时保留:原始数值和离散变量?

其次,不是bin01,bin02,没有办法获得[0-100],[101-150]等类型的bin,所以我知道哪个bin有什么值?

0 投票
2 回答
1704 浏览

r - 从 tidymodels 绘制决策树结果

我已经设法使用该包构建了一个决策树模型,tidymodels但我不确定如何提取结果并绘制树。我知道我可以使用rpartandrpart.plot包来实现相同的目标,但我宁愿使用tidymodels它,因为这是我正在学习的。下面是一个使用mtcars数据的例子。

我得到的错误说Error in rpart.plot(tree_wf$fit$fit) : Not an rpart object这是有道理的,但我不知道是否缺少我将结果转换为rpart.plot允许我绘图的格式的包或步骤。这可能是不可能的,但任何帮助将不胜感激。

0 投票
0 回答
217 浏览

r - 嵌入库安装问题——***捕获段错误***地址0x7f87b33be008,导致“无效权限”

尝试从 tidymodels R 包安装嵌入库,我收到以下错误。还提供了我的会话信息详细信息。

我想知道 *** 抓到 segfault *** 地址 0x7f87b33be008,导致“无效权限”是什么意思

我的 sessionInfo() 详细信息如下:

会话信息()

0 投票
1 回答
292 浏览

r - tidymodels - 使用 step_ns() 的 fit_resamples 错误

我正在尝试编写一个适合从使用 step_ns() 的配方中重新采样的函数。出于某种原因,我收到错误消息:

Fold01: recipe: Error: Not all variables in the recipe are present in the supplied training set

等等所有的折叠。接着

警告信息: All models failed in [fit_resamples()]. See the .notes column.

这是我的代码:

基本上,参数data采用两列表,并且outcome是结果列的名称。除了使用此功能(我只是在这里玩 tidymodels,因为我是新手),我只想了解导致此错误的原因以及如何修复它。评估时出现错误mod_with_splines

这里遇到了类似的问题。但我不知道这是否与我的问题有关。我不能在把菜谱传给之前先做好准备fit_resamples。(或者我认为)

任何帮助,将不胜感激。谢谢。

0 投票
1 回答
294 浏览

r - nls 缺失值或无穷大产生

我正在尝试使用这样的 Chapman-Richards 函数对嵌套数据进行建模: https ://image.slideserve.com/575351/testing-eichhorn-s-rule35-n.jpg

我的原始数据如下所示:

我创建了一个增长模型:

当我嵌套数据以为每个嵌套创建模型时:

我收到以下错误:

我知道数据的变化可能很小。

如果我尝试 alg="plinear",我会收到以下错误:

我已尝试将其更改为 robustbase::nlrob 以防万一效果更好。

这会将错误代码更改为:

有谁知道是什么导致了我这个问题或如何解决它?非常感谢!