问题标签 [r-parsnip]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
survival-analysis - 无法在 tidymodels 中调整审查包
Tidymodels 是一个了不起的包!审查数据在医学研究中非常普遍。当我尝试使用 'censored' 包调整 'boost_tree' 模型时,出现错误:' Unknown mode
for parsnip model。防风草似乎不支持“审查回归”模式?非常渴望解决!
r - 如何使用 R tidymodels 工作流程拟合没有截距的模型?
如何使用此tidymodels
工作流程拟合模型?
r - Tidymodels,所有模型失败;model.frame.default 中的错误和秩不足拟合的预测可能会产生误导
我在使用 tidymodels-tuning 时遇到问题,它会给出错误和警告:
- 警告:
prediction from a rank-deficient fit may be misleading
- 错误:
Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = ob...
注 1:我正在对正常 CV 折叠和空间 CV 折叠进行调整
注 2:我想包含数据,但 Stack Overflow 给了我:正文限制为 30000 个字符;您输入了 143552。如果您愿意,我可以将数据发送给您!
定义 lm 模型
定义 glm 模型
我已经在这里、这里和这里进行了一些研究,但仍然没有真正了解我的预处理步骤可能会导致这些问题。
做了一个reprex
由reprex 包(v2.0.1)于 2021-09-03 创建
r - 使用“pred_yes”列作为 roc_curve() 的估计参数的问题
当我运行以下数据时,它显示了不正确的 roc_curve。
准备
使用 r-studio 的任何人都应该可以运行以下代码。数据框包含不同员工的特征:绩效评级、销售数据以及他们是否被提升。
我正在尝试创建一个决策树模型,该模型使用所有其他变量来预测员工是否被提升。这个问题的主要目的是找出我在尝试使用 roc_curve() 函数时做错了什么。
创建测试/训练数据
使用我自己自制的 train_test() 函数只是为了好玩!
创建决策树模型结构/最终模型/预测数据框
计算并绘制 ROC 曲线
当我使用 .pred_yes 列作为估计列时,它会计算出与我想要的相反的 ROC 曲线。似乎它已将 .pred_no 确定为“真实”估计列
想法
当我将 pred_no 作为估计列提供给 roc_curve() 时,问题似乎消失了
仅供参考:这是我的第一个堆栈溢出帖子,如果您有任何建议使这篇文章更清晰/格式更好,请告诉我!
r - tidymodels - predict() 和 fit() 在应用于同一数据集时给出不同的模型性能结果
目前使用该tidymodels
框架并努力理解我得到的模型预测和性能结果的一些差异,特别是当我在完全相同的数据集(即模型训练的数据集)上同时使用两者fit
时。predict
下面是一个可重现的示例 - 我正在使用单元数据集并在数据上训练一个随机森林 ( rf_fit
)。该对象rf_fit$fit$predictions
是我评估其准确性的一组预测之一。然后,我rf_fit
通过该函数对相同的数据进行预测predict
(产量rf_training_pred
,我评估其准确性的另一组预测)。
我的问题是 - 为什么这些预测集彼此不同?为什么它们如此不同?
我认为某些事情必须在我不知道的情况下发生,但我希望这些是相同的,因为我假设fit()
训练了一个模型(并且有一些与这个训练过的模型相关的预测)然后predict()
采取该精确模型并将其重新应用于(在这种情况下)相同的数据 - 因此两者的预测应该是相同的。
我错过了什么?任何建议或帮助理解将不胜感激 - 在此先感谢!
由reprex 包于 2021-09-25 创建(v2.0.1)
r - tidymodels - 如何从 xgboost 中提取经过训练的模型预测?
目前使用该tidymodels
框架并努力理解随机森林(使用ranger
)和增强回归树(使用xgboost
)的训练模型输出的一些差异。
我的问题是关于使用xgboost
- 特别是如何访问预测/拟合正在训练的基础模型的训练数据(不使用predict
)。
为了澄清我的意思,在拟合随机森林模型时,我可以通过rf_fit
两种方式探索拟合模型(在下面的 reprex 中)及其对训练数据的预测。
- 使用
predict()
-调用predict(rf_fit, cells, type = "prob"
。(方法一)。 rf_fit
直接从 ( ) 获取预测rf_fit$fit$predictions
(方法 2)。
由于此处已阐明的原因,这些导致不同的预测。
在这种情况下,我对提升回归树和我的对象的等价物rf_fit$fit$predictions
(即方法 2)特别感兴趣。xgb_fit
我的问题有两个:
xgb_fit
训练模型的预测在哪里?(即rf_fit$fit$predictions
我们在随机森林模型中得到的等价物在哪里)?或者,我需要添加什么才能输出这些预测?- 如果以上是可能的,我应该如何解释这些预测?它们与 call 不同
predict
吗?如果是这样,它们代表什么(我收集的袋外估计对于提升回归树来说并不重要)?
(基本上,我想要training_logloss
在 1000 次迭代时产生错误的模型的预测xgb_fit$fit$evaluation_log
)。
由reprex 包于 2021-10-05 创建(v2.0.1)
spline - tidymodels 中是否有用于实现空间插值算法(例如克里金法、样条曲线)的 R 模型?
我从 parsnip 包中找到了用于实现 IDW 空间插值算法的 K-最近邻模型。tidymodels 中是否有用于实现其他类型的空间插值算法(例如克里金法、样条曲线)的 R 模型?我想避免使用 gstat 包中的函数“krige”和“smooth.spline”,因为使用 tidymodels 更容易调整参数。
time-series - 如何在 tidymodels 中创建一个简单的时间序列朴素模型
如何为以下模型创建欧洲防风草模型对象:
r - 使用工作流包时出错:无效的类“模型”对象
我正在尝试为我的数据建立逻辑回归模型。假设它看起来像这样。
搅动 | 年龄 | 性别 |
---|---|---|
0 | 22 | 1 |
1 | 53 | 0 |
0 | 65 | 1 |
1 | 36 | 1 |
0 | 40 | 1 |
1 | 25 | 0 |
0 | 60 | 1 |
我试图借助“工作流程”包来预测客户流失。这就是我所做的:
但是,当我尝试编织文件时,会收到以下消息:
无效的类“模型”对象:类“模型”中插槽“公式”的无效对象:得到类“工作流”,应该是或扩展类“公式”
我在互联网上的任何地方都找不到有关此错误的任何提及,我真的不明白如何处理它。