“broom”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

597 浏览

r - 如何在来自两个数据帧的分组值之间执行操作

我有两个数据框：

我想要做的是对两个数据框中按分组的列执行操作（ ks.test()）。例如，S1 和 P1 的 KS 检验的 p 值为：scoreSample_name

我想要做的是对所有操作执行所有操作，以便最终得到这样的表

我怎样才能做到这一点？最好是快速的，因为其中的样本数量ref_table可能很大（P1，P2 .... P10k）。

r dplyr tidyverse broom

2017-05-04T02:43:51.137

0 投票

1 回答

45 浏览

r - GLM 解析分类系数

我正在尝试创建整洁的数据，并且正在尝试将章程值与字段名称分开

有没有办法将 first_letter 和 C 分开？

我想在数据框中使用估计值、术语和字符以供将来使用。任何帮助，将不胜感激！

r glm tidyverse broom

2017-05-04T17:14:46.610

0 投票

2 回答

812 浏览

r - 如何使用 broom 和 dplyr 在多列上拟合分布

我有以下数据：

我可以这样计算列 X：

我怎样才能对所有列（除了第一个 - genes）执行此操作，以便最终我得到：

r dplyr tidyverse broom

2017-05-08T14:13:31.057

0 投票

1 回答

45 浏览

r - 如何基于对数正态参数构造向量

我有以下向量：

我可以得到以下参数：

我的问题是如何创建与使用上述参数bar相同长度的新向量（我们称之为）？foo

我试过这个（很可能是错的）：

r broom

2017-05-09T02:14:50.020

0 投票

0 回答

49 浏览

r - 扫帚，子组的回归：如何处理 reg 子组中的错误？

我正在使用dplyr+broom包为我的每个子组运行单独的回归

（实际数据是受限访问，不能在这里分享）

我收到以下错误：

如果我理解正确，这意味着无法对某些子组运行回归，可能是由于某些变量中的所有 NA。

我怎样才能捕捉到这些错误，以便最终我收到一个数据集，其中包含回归成功运行的子组的回归输出？

编辑：尝试了类似于评论中建议的链接的语法并遇到了同样的问题：

lm.fit（x，y，offset = offset，singular.ok =singular.ok，...）中的错误：0（非 NA）案例

r dplyr broom

2017-05-12T17:12:20.453

0 投票

1 回答

1964 浏览

r - 在 purrr 中处理不同长度的向量

我目前有以下R代码运行具有不同预测变量、跨不同子集的多个回归模型，并使用broom包返回整理后的输出。

这将产生以下数据框：

在不使用循环函数的情况下将结果向量（例如outcomes<-c("mpg", "qsec")）合并到此脚本中的最佳方法是什么？我已经考虑过包中的map2_df函数，purrr但它要求两个向量的长度相同。我想要的数据框如下所示：

r dplyr purrr broom

2017-05-14T16:10:04.377

0 投票

3 回答

1456 浏览

r - 使用 ggplot2 绘制具有多个子多边形和孔的 SpatialPolygons

我想SpatialPolygons从spggplot2 中有孔的库中绘图。感谢其他关于stackoverflow的问题，我知道在处理顺时针书写的多边形时这是允许的：
http
://stackoverflow.com/questions/12047643/geom-polygon-with-multiple-hole/12051278#12051278 事实上，当转换一个SpatialPolygons使用broom::tidy（替换ggplot2::fortify），孔多边形按顺时针方向保存以绘制为孔。
在 ggplot2 中，绘制带孔的多边形的方式强制使用绘制它们一次fill，然后使用绘制它们colour，否则您可能会看到线穿过多边形。当处理多个子多边形时，有些带有孔，这更棘手，点特征的顺序定义为broom::tidy可能不允许填充多边形（见下图）。
你们中的任何人都有摆脱这种填充问题行为的解决方案吗？

这是一个可重现的示例：

_{（来源：statnmap.com）}

r ggplot2 polygon geospatial broom

2017-05-23T16:45:21.567

0 投票

0 回答

352 浏览

r - 如何在 spark 数据帧上使用 sparklyr 与在 R 数据帧上使用 dplyr 获得相同的结果？

以下代码计算三个因变量中的每一个的一组回归系数，这些因变量在两组中的每一个的六个自变量的集合上回归，并且工作正常。

我想使用 spark 数据框而不是 R 数据框来复制相同的逻辑。例如，类似于以下内容：

此代码失败主要是因为我需要使用“ml_linear_regression”而不是“lm”，但即使进行替换它也会失败。如果我保留“ml_linear_regression”，但删除 cbind() 并仅保留一个因变量，则计算一些系数，尽管 broom::tidy 无法获取系数。

有没有办法在 sparklyr 框架中产生这个结果，或者如果需要的话，用另一种方法？

r apache-spark dplyr sparklyr broom

2017-05-24T15:40:06.890

0 投票

1 回答

856 浏览

r - modelr::bootstrap 或 broom::bootstrap 和分组问题

我有一个长数据集，它由多个插补产生的几个数据集组成（比如说 10 个插补）。他们有一个标识插补的 id 变量。在每个估算的数据集上，我想引导 10 个数据集。在引导之后，我想在每个（100 个，插补引导组合）上运行模型。

在这个例子中，我不确定是使用broom::bootstrap()函数还是modelr::bootstrap()函数。此外，分组似乎在我的管道中丢失了。

这是使用 mtcars 数据集的可重现示例：

正如您所看到的，输出当前显示有两个组，这是应该的。在我的数据集中，它会显示每个估算数据集有 10 个。现在：

现在看起来好像只有 10 个组代表每个重复。它似乎没有保留先前的分组。在这一点上，我预计总共有 20 个组（2 x 10）。

如果我现在这样做：

现在似乎没有复制只有组am。

在我对原始数据集进行分组后，无论如何都要进行引导。此外，理想情况下，在我引导之后，应该有一个 id 指示我正在查看哪个引导数据集。

在我的理想世界中，我的代码应该能够执行以下操作：

r tidyverse statistics-bootstrap broom modelr

2017-05-25T09:43:10.140

0 投票

1 回答

1780 浏览

r - 在列表列中使用 lm 使用 purrr 预测新值

我正在尝试将一列预测添加到具有包含 lm 模型的列表列的数据框中。我采用了这篇文章中的一些代码。

我在这里做了一个玩具例子：

这给了我一个看起来像这样的小标题：

要使用特定组的 lm 模型获得预测值，我可以使用以下方法：

产生这个结果：

我想为每一组做一个新的预测。我尝试使用 purrr 来获得我想要的东西：

但这给出了以下错误：

我能够通过以下怪物获得我想要的结果：

这给了我一个看起来像这样的小标题：

一定有办法以“整洁”的方式做到这一点，但我就是无法破解它。

r tidyverse purrr broom

2017-06-22T21:46:52.210

问题标签 [broom]

Reference