问题标签 [tidyverse]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
378 浏览

r - 如何将大量模型传递给gather_predictions

modelr包中,该函数gather_predictions可用于将来自多个模型的预测添加到数据框中,但是我不确定如何在函数调用中指定这些模型。帮助文档提供了以下示例:

这里的模型在函数调用中特别提到。如果我们有一些我们想要预测的模型,那效果很好,但是如果我们有大量或未知数量的模型怎么办?在这种情况下,手动指定模型不再可行。

帮助文档对参数段的表述方式似乎表明您需要将每个模型添加为单独的参数。

gather_predictions 和 spread_predictions 采用多个模型。该名称将取自模型名称的参数名称。

例如,将模型列表输入到gather_predictions 中是行不通的。

有没有一些简单的方法可以输入一个列表/大量模型来收集预测?

列表中 10 个模型的示例:

如果将模型以其他方式存储而不是列表效果更好,那也很好。

0 投票
2 回答
60 浏览

r - 使用另一个数据框完成并填充组中的缺失数据

如何按组完成缺失值?

我有一个带有推荐和排名的 df,当我没有至少 4 个时,我需要插入默认推荐。

输入示例:

我试图用完整/填充来做到这一点,但它不尊重组,它也削减了等级范围之外的值。

期望的输出:

0 投票
4 回答
294 浏览

r - 在 R 中使用正则表达式进行字符串拆分和截断

我正在寻求帮助在 R 中实现一个函数来截断level_stream我在 R 中的数据帧的字符串向量,但还没有太多运气。本质上,当列中的一行pre_quiz_score不是NA时,我想截断字符串的开始部分直到(包括)第一个字符,如果 a不是该行|,我想截断最后一个字符之后的所有内容。|post_quiz_scoreNA

我想以“tidyverse”的方式实现它并矢量化以获得类似的东西

到目前为止,我还没有得到stringr::str_split, gsub, orsub正常工作,主要是因为我最终只删除了|'s 或所有字符串,但最后一个|和之后。

我希望这是有道理的,谢谢!

0 投票
2 回答
1086 浏览

r - 忽略 readr::read_csv 中的尾随分隔符

当我使用 读取包含尾随分隔符的 CSV 文件时readr::read_csv,我收到一条警告,指出已填写了缺少的列名。以下是重现此警告的简短示例 CSV 文件的内容(将以下代码段存储在名为 的文件中example.csv):

请注意每行末尾的尾随逗号。现在如果我加载这个文件

我收到以下警告:

即使我只想显式加载 3 列

我仍然收到警告信息。

这是预期的行为还是有什么方法可以告诉read_csv它应该忽略除我指定的列之外的所有列?还是有另一种方法来整理这个(显然格式错误的)CSV,以便删除/忽略尾随分隔符?

0 投票
2 回答
879 浏览

r - 在 dplyr::mutate 中使用 purrr::map 将不同的启动参数应用于模型

试图在 ggplot2 邮件列表中回答某人的问题,但我无法弄清楚: https ://groups.google.com/forum/#!topic/ggplot2/YgCqQX8JbPM

OP 希望将不同的起始参数应用于 nls 模型的数据子集。我的想法是他应该阅读 dplyr 和 purrr,但在尝试了几个小时后,我遇到了障碍。不确定这是一个错误还是我缺乏 purrr 的经验。

感觉与这个错误有关,但这已经修复了一段时间...... https://github.com/hadley/dplyr/issues/1447

据我所知,它正在寻找嵌套 tibble 范围内的变量,但我希望它在 mutate 调用的范围内。我不知道有没有办法解决这个问题。

0 投票
2 回答
1145 浏览

r - 为列表列数据框的每一行拟合不同的模型

使用 tidyverse 中的 list-columns 数据结构来拟合因数据框的行而异的不同模型公式的最佳方法是什么?

在 R for Data Science 中,Hadley 提供了一个很好的示例,说明如何使用列表列数据结构并轻松拟合许多模型 ( http://r4ds.had.co.nz/many-models.html#gapminder )。我试图找到一种方法来拟合许多公式略有不同的模型。在下面改编自他的原始示例的示例中,为每个大陆拟合不同模型的最佳方法是什么?

我知道我可以通过遍历 by_continent 来做到这一点(效率不高,因为它估计了每个大陆的每个模型:

但是是否有可能在不跟随基础 R 循环的情况下执行此操作(并避免拟合我不需要的模型)?

我尝试的是这样的:

但我似乎无法想出一个有效的 est_model 函数。我尝试了这个不起作用的功能(h/t:https ://gist.github.com/multidis/8138757 ):

(诚​​然,这是一个人为的例子。我的实际情况是,我的数据中有大量观察缺失关键自变量,所以我想在一个模型中拟合一个包含所有变量的完整观察值,而另一个模型只有一个变量的子集休息观察。)

更新

我想出了一个有效的 est_model 函数(尽管可能效率不高):

0 投票
2 回答
93 浏览

r - 在小标题中有列表的列中结转的最后一个对象

我正在寻找一个函数来帮助填充包含具有先前值的列表的列的元素。

“LotsOfLists”列有一些由于连接而为 NULL 的列表。我想让 NULL 被最后一个列表替换。我希望它的工作方式与 zoo 包中的 na.locf() 类似,该包用最后一个结转的对象填充 NA,但找不到适用于列表列的任何内容。

编辑:

最初的问题得到了回答,但事实证明,如果该列有 data.frames 答案不起作用。任何人都可以找到data.frames的解决方案吗?

0 投票
2 回答
1091 浏览

r - 使用 tidyverse 扩展数据框

这是我正在尝试做的一个例子:

请注意,开始和结束值hello取决于数据,因此每个的行数id是动态的。我正在寻找可能涉及expandtidyr 但正在苦苦挣扎的解决方案。

0 投票
1 回答
351 浏览

r - 小标题中的列表列:我可以将一个列表列与另一个列表列链接吗?

这是我的第一篇文章,所以如果我听起来很傻或者我正在寻找的答案已经存在,请原谅我。

我的主要问题是:我创建了一个包含 4 列(一个字符列、两个数据列和一个包含字符列每个级别的距离矩阵的列)的小标题,我正在尝试创建一个使用第四列的距离矩阵作为因变量,第二列的一些自变量。问题是 R 一直警告我它找不到因变量。

我使用的包如下:

包含我的 IV 的小标题如下所示:

然后我嵌套它:

这是它的外观:

随后,我创建了另一个包含原始存在/不存在数据的小标题:

然后我也嵌套了那个小标题:

它看起来像:

我重命名数据列,以便将它与包含 IV 的小标题连接起来:

作为下一步,我构造了一个函数来计算矩阵:

rr 小标题现在看起来像这样:

然后,我加入了两个 tibbles:

小标题看起来像这样:

我要应用的功能如下所示:

当我尝试使用以下代码计算它时:

my_tibble <- my_tibble %>% mutate(mrm = map(IVs,mrm_model)),

我收到此错误消息:

Error in mutate_impl(.data, dots) : object 'Dist.matrix' not found.

你知道为什么这会不断弹出吗?

当我尝试使用 $ 符号“更正”函数时:

mrm_model <- function(df){ecodist::MRM(my_tibble$Dist.matrix~dist(Area),data = (df))},

我收到以下警告:

Error in mutate_impl(.data, dots) : invalid type (list) for variable 'my_tibble$Dist.matrix'.

在这种类型的数据操作方面,我绝对是新手,所以显然我已经过头了,我将非常感谢我能得到的所有帮助。

0 投票
1 回答
282 浏览

r - 使用 map 和 purrr 在 listcolumn 中分配 NA

我想将列表列 l 中低于 2 的所有值设置为 NA。如何使用地图在 purrr-world 中做到这一点?

引发错误。

更新:

给了我额外的列,但列表列的每个元素中没有两个数字和一个 NA

更新二:替换是我的朋友,并且成功了: