问题标签 [r-parsnip]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

23 问题

0 投票

0 回答

56 浏览

survival-analysis - 无法在 tidymodels 中调整审查包

Tidymodels 是一个了不起的包！审查数据在医学研究中非常普遍。当我尝试使用 'censored' 包调整 'boost_tree' 模型时，出现错误：' Unknown modefor parsnip model。防风草似乎不支持“审查回归”模式？非常渴望解决！

2021-08-15T02:56:33.723

0 投票

1 回答

84 浏览

r - 如何使用 R tidymodels 工作流程拟合没有截距的模型？

如何使用此tidymodels工作流程拟合模型？

r tidymodels r-parsnip

2021-08-31T20:12:21.603

0 投票

1 回答

90 浏览

r - Tidymodels，所有模型失败；model.frame.default 中的错误和秩不足拟合的预测可能会产生误导

我在使用 tidymodels-tuning 时遇到问题，它会给出错误和警告：

警告：prediction from a rank-deficient fit may be misleading
错误：Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = ob...

注 1：我正在对正常 CV 折叠和空间 CV 折叠进行调整

注 2：我想包含数据，但 Stack Overflow 给了我：正文限制为 30000 个字符；您输入了 143552。如果您愿意，我可以将数据发送给您！

定义 lm 模型

定义 glm 模型

我已经在这里、这里和这里进行了一些研究，但仍然没有真正了解我的预处理步骤可能会导致这些问题。

做了一个reprex

^{由reprex 包（v2.0.1）于 2021-09-03 创建}

r machine-learning dplyr tidymodels r-parsnip

2021-09-03T09:46:21.353

0 投票

1 回答

57 浏览

r - 使用“pred_yes”列作为 roc_curve() 的估计参数的问题

当我运行以下数据时，它显示了不正确的 roc_curve。

准备

使用 r-studio 的任何人都应该可以运行以下代码。数据框包含不同员工的特征：绩效评级、销售数据以及他们是否被提升。

我正在尝试创建一个决策树模型，该模型使用所有其他变量来预测员工是否被提升。这个问题的主要目的是找出我在尝试使用 roc_curve() 函数时做错了什么。

创建测试/训练数据

使用我自己自制的 train_test() 函数只是为了好玩！

创建决策树模型结构/最终模型/预测数据框

计算并绘制 ROC 曲线

当我使用 .pred_yes 列作为估计列时，它会计算出与我想要的相反的 ROC 曲线。似乎它已将 .pred_no 确定为“真实”估计列

想法

当我将 pred_no 作为估计列提供给 roc_curve() 时，问题似乎消失了

仅供参考：这是我的第一个堆栈溢出帖子，如果您有任何建议使这篇文章更清晰/格式更好，请告诉我！

r decision-tree roc tidymodels r-parsnip

2021-09-07T16:27:20.220

0 投票

1 回答

149 浏览

r - tidymodels - predict() 和 fit() 在应用于同一数据集时给出不同的模型性能结果

目前使用该tidymodels框架并努力理解我得到的模型预测和性能结果的一些差异，特别是当我在完全相同的数据集（即模型训练的数据集）上同时使用两者fit时。predict

下面是一个可重现的示例 - 我正在使用单元数据集并在数据上训练一个随机森林 ( rf_fit)。该对象rf_fit$fit$predictions是我评估其准确性的一组预测之一。然后，我rf_fit通过该函数对相同的数据进行预测predict（产量rf_training_pred，我评估其准确性的另一组预测）。

我的问题是 - 为什么这些预测集彼此不同？为什么它们如此不同？

我认为某些事情必须在我不知道的情况下发生，但我希望这些是相同的，因为我假设fit()训练了一个模型（并且有一些与这个训练过的模型相关的预测）然后predict()采取该精确模型并将其重新应用于（在这种情况下）相同的数据 - 因此两者的预测应该是相同的。

我错过了什么？任何建议或帮助理解将不胜感激 - 在此先感谢！

^{由reprex 包于 2021-09-25 创建(v2.0.1)}

r random-forest tidymodels r-parsnip

2021-09-25T11:26:21.057

0 投票

0 回答

93 浏览

r - tidymodels - 如何从 xgboost 中提取经过训练的模型预测？

目前使用该tidymodels框架并努力理解随机森林（使用ranger）和增强回归树（使用xgboost）的训练模型输出的一些差异。

我的问题是关于使用xgboost- 特别是如何访问预测/拟合正在训练的基础模型的训练数据（不使用predict）。

为了澄清我的意思，在拟合随机森林模型时，我可以通过rf_fit 两种方式探索拟合模型（在下面的 reprex 中）及其对训练数据的预测。

使用predict() -调用predict(rf_fit, cells, type = "prob"。（方法一）。
rf_fit直接从 ( ) 获取预测rf_fit$fit$predictions（方法 2）。

由于此处已阐明的原因，这些导致不同的预测。

在这种情况下，我对提升回归树和我的对象的等价物rf_fit$fit$predictions（即方法 2）特别感兴趣。xgb_fit我的问题有两个：

xgb_fit 训练模型的预测在哪里？（即rf_fit$fit$predictions我们在随机森林模型中得到的等价物在哪里）？或者，我需要添加什么才能输出这些预测？
如果以上是可能的，我应该如何解释这些预测？它们与 call 不同predict吗？如果是这样，它们代表什么（我收集的袋外估计对于提升回归树来说并不重要）？

（基本上，我想要training_logloss在 1000 次迭代时产生错误的模型的预测xgb_fit$fit$evaluation_log）。

^{由reprex 包于 2021-10-05 创建(v2.0.1)}

r machine-learning xgboost tidymodels r-parsnip

2021-10-05T15:31:35.357

0 投票

0 回答

35 浏览

spline - tidymodels 中是否有用于实现空间插值算法（例如克里金法、样条曲线）的 R 模型？

我从 parsnip 包中找到了用于实现 IDW 空间插值算法的 K-最近邻模型。tidymodels 中是否有用于实现其他类型的空间插值算法（例如克里金法、样条曲线）的 R 模型？我想避免使用 gstat 包中的函数“krige”和“smooth.spline”，因为使用 tidymodels 更容易调整参数。

spline tidymodels kriging spatial-interpolation r-parsnip

2021-10-12T11:46:42.660

0 投票

0 回答

21 浏览

time-series - 如何在 tidymodels 中创建一个简单的时间序列朴素模型

如何为以下模型创建欧洲防风草模型对象：

time-series tidymodels r-parsnip

2021-10-27T12:04:59.970

0 投票

1 回答

28 浏览

r - 我们如何从欧洲防风草对象中提取协方差矩阵？

r tidymodels r-parsnip

2021-11-13T12:23:11.583

0 投票

0 回答

21 浏览

r - 使用工作流包时出错：无效的类“模型”对象

我正在尝试为我的数据建立逻辑回归模型。假设它看起来像这样。

搅动	年龄	性别
0	22	1
1	53	0
0	65	1
1	36	1
0	40	1
1	25	0
0	60	1

我试图借助“工作流程”包来预测客户流失。这就是我所做的：

但是，当我尝试编织文件时，会收到以下消息：

无效的类“模型”对象：类“模型”中插槽“公式”的无效对象：得到类“工作流”，应该是或扩展类“公式”

我在互联网上的任何地方都找不到有关此错误的任何提及，我真的不明白如何处理它。

r logistic-regression r-parsnip

2021-12-11T05:01:05.313

1 2 3 4 5 6 7 8 9 10

问题标签 [r-parsnip]

准备

创建测试/训练数据

创建决策树模型结构/最终模型/预测数据框

计算并绘制 ROC 曲线

想法

Reference