问题标签 [r-recipes]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - tidymodels metric_set:错误:“metric_set()”的所有输入都必须是函数。这些输入不是: (2)
我recipe()
在包中使用函数tidymodels
来估算缺失值和修复不平衡数据。
这是我的数据;
这是我的代码;
直到这里它都可以正常工作现在我正在使用metric_set()
函数来适应每个重采样。
这是我的代码如下:
我收到错误说:
但它在没有准确度参数的情况下工作
有人对如何做到这一点有任何建议吗?非常感谢您的帮助!
r - 警告消息:所有模型在 [fit_resamples()] 中均失败。请参阅 `.notes` 列
我recipe()
在包中使用函数tidymodels
来估算缺失值和修复不平衡数据。
这是我的数据;
这是我的代码;
直到这里它都可以正常工作现在我正在使用fit_resamples
函数来拟合每个重采样的逻辑回归。
这是我的代码如下:
我收到警告说:
有人对如何做到这一点有任何建议吗?非常感谢您的帮助!
r - 仅在 tidymodels 的配方中选择有序因子
我需要使用来自 tidymodels 的食谱包创建一个食谱。在其中一个步骤中,我需要将有序因子转换为它们的序数分数。但是似乎没有可以用来选择所有有序因子的函数。
我知道有一个名为 的函数all_nominal()
,但它匹配作为因子的每一列,它可以是有序的或无序的。我也尝试过has_type("ordered")
,但这也不起作用。
目前,我必须手动输入列名。有没有更简单的方法来做到这一点?
下面是我想做的一个例子:
欢迎任何帮助,谢谢。
r - 为什么我们需要在 tidymodels 中进行准备、烘焙和榨汁?
prep()
我总是在不使用、bake()
或的情况下完成我的模型以进行拟合和预测juice()
:
这些 ( prep
, bake
, juice
) 函数是否仅用于目视检查数据的预处理结果,而不是拟合/训练过程所必需的?
R 包“食谱”中的 prep/bake/juice 有什么区别?
上面的代码是我在官方教程中学到的。
我在另一个博客中读到,如果你使用train_data
,会产生数据泄漏。我想听听更多关于它的信息;这些功能是否与数据泄露有关?
r - 在具有更新角色条件的 R 配方中不起作用
如果variable_names
包含名称我想更新那些成为 Not_predictors 的角色;而如果variable_names
是 NA 我想在函数中跳过这一步。但是,在添加条件时,我得到了错误。请参阅下面的 repex 代码。
这是错误:
任何帮助深表感谢。
r - 食谱包无法在 step_interact 中创建交互项
我正在使用医疗保险数据集来磨练我的建模技能,如下所示:
我使用recipes
作为tidymodels
元数据包的一部分来准备我的数据以在模型中使用,并且我已经确定了bmi
、age
和 ,并smoker
形成了一个交互项。
根据tidymodels 指南/文档,我必须将交互指定为 as 中的一个recipe
步骤step_interact
。但是,当我尝试这样做时出现错误:
我是建模新手,不太确定为什么会出现此错误。我只是试图charges
说明所有其他预测变量都可以解释这一点,并且smoker
(是/否因素)、age
(数字)和bmi
(双)都相互作用以告知结果。我究竟做错了什么?
r - 在 R 中,当在配方中包含 step_pca 时,工作流程中的错误
在 tidymodels 中,我想创建一个基于配方和模型规范的工作流。当我不包含 step_pca(); 但是当我包含 step_pca() 作为设置时,我得到了错误。请参阅重复打击。
(如果我不使用工作流(),它可以工作;但是我失去了包括更新角色在内的功能)
提前致谢
r - 在R中,在tidymodels的配方中选择X个第一个PCA组件
我想在配方中计算出第 X 个 PCA 组件后选择它们。然后我想在工作流程中添加这个配方。
请参阅下面的示例数据。
r - R tidymodels 配方接近数字属性的零方差过滤器
我在使用 R tidymodels 食谱中的 step_nzv 来过滤掉具有小方差但连续值的数字属性时遇到了麻烦。在我看来,该步骤仅适用于名义值,因为它计算唯一值的数量以及最常见与第二常见的比率。但是我有一个属性,它几乎无处不在接近零,从不为零。我是否必须先装箱(并用相同大小的垃圾箱离散化会改变一切)?在下面的代码中,我有一个最小的示例。我希望两个列 low_variance_num 和 low_variance_nom 都被过滤掉,这不会发生:
PS:有没有办法在不提供配方的情况下使用食谱?在这种情况下,公式是无稽之谈。