问题标签 [r-recipes]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 未应用 step_pca() 参数
我是 tidymodels 的新手,但显然在接受培训时,step_pca()
诸如nom_comp
或未threshold
实施之类的论点。如下例所示,尽管设置了nom_comp = 2
.
r - 应用 step_dummy 时,tune 包如何处理 mtry 超参数
我正在为 xgboost 模型定义网格grid_latin_hypercube()
。我知道mtry
超参数应该使用finalize()
函数或使用 range 参数手动完成mtry()
。
假设我有一个包含 10 个变量的数据框:1 个 id、1 个结果、7 个数字预测变量和 1 个具有 10 个相同频率类的分类预测变量,我运行以下代码:
tune
假设网格超参数是使用具有 10 个变量的数据框完成的,如何处理由配方生成的新预测变量集 (9 - 2 + 10 = 17)?
r - 如何准备配方,包括可调参数?
正如您从我的代码中看到的那样,我正在尝试将特征选择包含在我的 tidymodels 工作流程中。我正在使用一些 kaggle 数据,试图预测客户流失。
为了将处理应用于测试和训练数据,我在使用 prep() 函数后烘焙配方。
但是,如果我想对 step_select_roc() 函数 top_p 参数进行调整,我不知道之后如何 prep() 配方。像在我的代表中一样应用它会导致错误。
也许我必须调整我的工作流程并分离一些配方任务才能完成工作。实现这一目标的最佳方法是什么?
r - 如何反转 step_woe 预处理配方步骤的因子水平
我正在“recipes”框架内对我的功能(使用“embed”包中的“step_woe”)应用 WOE(证据权重)转换,但默认情况下它采用 0 值作为参考,因此 WOE 值是相反的。
我正在尝试重新调整目标以将“1”设置为参考,但结果是相同的(灾难值的方向没有变化)。知道如何正确处理吗?
这是一个示例,首先我创建示例数据集,其中包含一个目标(0 和 1)和一个特征(“是”、“否”)彼此之间的完美关系。然后我应用 step_woe 转换,同时将参考水平设置为“0”或“1”以比较结果,没有差异。
由reprex 包于 2022-02-02 创建(v0.3.0)
r - 如何使用 tidymodels 和工作流集在同一数据集上拟合多个不同的线性模型
我想在同一个数据集上评估几个(主要是)线性回归模型的性能。我想也许使用tidymodels
包和workflowsets::workflow_set()
可能的工作。我遵循了此处的示例,但我无法弄清楚如何从代码中实际获得合适的结果。
看来这实际上并不适合模型本身。我需要什么/在哪里添加代码以适应线性模型?
或者,是否有更好但仍然“整洁”的方式来做到这一点?接受建议。
r - tidymodels 食谱:我可以使用 step_dummy() 对只需要 1 个虚拟对象的分类变量 * 除外 * 布尔值进行一次热编码吗?
如果一个分类变量的值超过 2 个(如婚姻状况 = 单身/已婚/丧偶/分居/离婚),那么我需要创建 N 个虚拟变量,每个可能级别一个。这是使用 step_dummy(one_hot = TRUE) 完成的。
但是,如果类别是二进制 (pokemon_fan = "yes"/"no"),那么我只需要创建一个名为 "pokemon_fan_yes" 的虚拟对象。这是使用 step_dummy(one_hot = FALSE) 完成的。
step_dummy 是否可以计算级别数并根据该数字进行不同的处理?
谢谢。
r - 如何使用 R 中的 repices 包应用反双曲正弦?
我正在探索该recipes
软件包以准备我的数据以进行线性回归。但即使是使用反双曲正弦对两个变量进行简单变换也不会产生我所期望的结果。我在这里做错了什么?
由reprex 包创建于 2022-03-01 (v2.0.1)
r - 如何从 recipes::step_dumm() 中排除 Char 变量?
如何在配方中保持character
ID 变量不变?PERSON_ID
我尝试update_role(PERSON_ID , new_role = "id variable")
并尝试将其从 step_dummy 中排除step_dummy(all_nominal_predictors(), -all_numeric_predictors(), -all_outcomes(), -has_role(match = "id variable")
。这没用。它仍然将 PERSON_ID 转换为因子。有什么建议吗?