问题标签 [r-parsnip]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
56 浏览

survival-analysis - 无法在 tidymodels 中调整审查包

Tidymodels 是一个了不起的包!审查数据在医学研究中非常普遍。当我尝试使用 'censored' 包调整 'boost_tree' 模型时,出现错误:' Unknown modefor parsnip model。防风草似乎不支持“审查回归”模式?非常渴望解决!

0 投票
1 回答
84 浏览

r - 如何使用 R tidymodels 工作流程拟合没有截距的模型?

如何使用此tidymodels工作流程拟合模型?

0 投票
1 回答
90 浏览

r - Tidymodels,所有模型失败;model.frame.default 中的错误和秩不足拟合的预测可能会产生误导

我在使用 tidymodels-tuning 时遇到问题,它会给出错误和警告:

  • 警告:prediction from a rank-deficient fit may be misleading
  • 错误:Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = ob...

注 1:我正在对正常 CV 折叠和空间 CV 折叠进行调整

注 2:我想包含数据,但 Stack Overflow 给了我:正文限制为 30000 个字符;您输入了 143552。如果您愿意,我可以将数据发送给您!

定义 lm 模型

定义 glm 模型

我已经在这里、这里和这里进行了一些研究仍然没有真正了解我的预处理步骤可能会导致这些问题。

做了一个reprex

reprex 包(v2.0.1)于 2021-09-03 创建

0 投票
1 回答
57 浏览

r - 使用“pred_yes”列作为 roc_curve() 的估计参数的问题

当我运行以下数据时,它显示了不正确的 roc_curve。

准备

使用 r-studio 的任何人都应该可以运行以下代码。数据框包含不同员工的特征:绩效评级、销售数据以及他们是否被提升。

我正在尝试创建一个决策树模型,该模型使用所有其他变量来预测员工是否被提升。这个问题的主要目的是找出我在尝试使用 roc_curve() 函数时做错了什么。

创建测试/训练数据

使用我自己自制的 train_test() 函数只是为了好玩!

创建决策树模型结构/最终模型/预测数据框

计算并绘制 ROC 曲线

当我使用 .pred_yes 列作为估计列时,它会计算出与我想要的相反的 ROC 曲线。似乎它已将 .pred_no 确定为“真实”估计列

想法

当我将 pred_no 作为估计列提供给 roc_curve() 时,问题似乎消失了

仅供参考:这是我的第一个堆栈溢出帖子,如果您有任何建议使这篇文章更清晰/格式更好,请告诉我!

0 投票
1 回答
149 浏览

r - tidymodels - predict() 和 fit() 在应用于同一数据集时给出不同的模型性能结果

目前使用该tidymodels框架并努力理解我得到的模型预测和性能结果的一些差异,特别是当我在完全相同的数据集(即模型训练的数据集)上同时使用两者fit时。predict

下面是一个可重现的示例 - 我正在使用单元数据集并在数据上训练一个随机森林 ( rf_fit)。该对象rf_fit$fit$predictions是我评估其准确性的一组预测之一。然后,我rf_fit通过该函数对相同的数据进行预测predict(产量rf_training_pred,我评估其准确性的另一组预测)。

我的问题是 - 为什么这些预测集彼此不同?为什么它们如此不同?

我认为某些事情必须在我不知道的情况下发生,但我希望这些是相同的,因为我假设fit()训练了一个模型(并且有一些与这个训练过的模型相关的预测)然后predict()采取该精确模型并将其重新应用于(在这种情况下)相同的数据 - 因此两者的预测应该是相同的。

我错过了什么?任何建议或帮助理解将不胜感激 - 在此先感谢!

reprex 包于 2021-09-25 创建(v2.0.1)

0 投票
0 回答
93 浏览

r - tidymodels - 如何从 xgboost 中提取经过训练的模型预测?

目前使用该tidymodels框架并努力理解随机森林(使用ranger)和增强回归树(使用xgboost)的训练模型输出的一些差异。

我的问题是关于使用xgboost- 特别是如何访问预测/拟合正在训练的基础模型的训练数据(使用predict)。

为了澄清我的意思,在拟合随机森林模型时,我可以通过rf_fit 两种方式探索拟合模型(在下面的 reprex 中)及其对训练数据的预测。

  • 使用predict() -调用predict(rf_fit, cells, type = "prob"。(方法一)。
  • rf_fit直接从 ( ) 获取预测rf_fit$fit$predictions(方法 2)。

由于此处已阐明的原因,这些导致不同的预测。

在这种情况下,我对提升回归树和我的对象的等价物rf_fit$fit$predictions(即方法 2)特别感兴趣。xgb_fit我的问题有两个:

  • xgb_fit 训练模型的预测在哪里?(即rf_fit$fit$predictions我们在随机森林模型中得到的等价物在哪里)?或者,我需要添加什么才能输出这些预测?
  • 如果以上是可能的,我应该如何解释这些预测?它们与 call 不同predict吗?如果是这样,它们代表什么(我收集的袋外估计对于提升回归树来说并不重要)?

(基本上,我想要training_logloss在 1000 次迭代时产生错误的模型的预测xgb_fit$fit$evaluation_log)。

reprex 包于 2021-10-05 创建(v2.0.1)

0 投票
0 回答
35 浏览

spline - tidymodels 中是否有用于实现空间插值算法(例如克里金法、样条曲线)的 R 模型?

我从 parsnip 包中找到了用于实现 IDW 空间插值算法的 K-最近邻模型。tidymodels 中是否有用于实现其他类型的空间插值算法(例如克里金法、样条曲线)的 R 模型?我想避免使用 gstat 包中的函数“krige”和“smooth.spline”,因为使用 tidymodels 更容易调整参数。

0 投票
0 回答
21 浏览

time-series - 如何在 tidymodels 中创建一个简单的时间序列朴素模型

如何为以下模型创建欧洲防风草模型对象:

0 投票
1 回答
28 浏览

r - 我们如何从欧洲防风草对象中提取协方差矩阵?

0 投票
0 回答
21 浏览

r - 使用工作流包时出错:无效的类“模型”对象

我正在尝试为我的数据建立逻辑回归模型。假设它看起来像这样。

搅动 年龄 性别
0 22 1
1 53 0
0 65 1
1 36 1
0 40 1
1 25 0
0 60 1

我试图借助“工作流程”包来预测客户流失。这就是我所做的:

但是,当我尝试编织文件时,会收到以下消息:

无效的类“模型”对象:类“模型”中插槽“公式”的无效对象:得到类“工作流”,应该是或扩展类“公式”

我在互联网上的任何地方都找不到有关此错误的任何提及,我真的不明白如何处理它。