问题标签 [broom]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
597 浏览

r - 如何在来自两个数据帧的分组值之间执行操作

我有两个数据框:


我想要做的是对两个数据框中按分组的列执行操作( ks.test()) 。例如,S1 和 P1 的 KS 检验的 p 值为:scoreSample_name


我想要做的是对所有操作执行所有操作,以便最终得到这样的表

我怎样才能做到这一点?最好是快速的,因为其中的样本数量ref_table可能很大(P1,P2 .... P10k)。

0 投票
1 回答
45 浏览

r - GLM 解析分类系数

我正在尝试创建整洁的数据,并且正在尝试将章程值与字段名称分开

有没有办法将 first_letter 和 C 分开?

我想在数据框中使用估计值、术语和字符以供将来使用。任何帮助,将不胜感激!

0 投票
2 回答
812 浏览

r - 如何使用 broom 和 dplyr 在多列上拟合分布

我有以下数据:


我可以这样计算列 X:


我怎样才能对所有列(除了第一个 - genes)执行此操作,以便最终我得到:

0 投票
1 回答
45 浏览

r - 如何基于对数正态参数构造向量

我有以下向量:

我可以得到以下参数:

我的问题是如何创建与使用上述参数bar相同长度的新向量(我们称之为) ?foo

我试过这个(很可能是错的):

0 投票
0 回答
49 浏览

r - 扫帚,子组的回归:如何处理 reg 子组中的错误?

我正在使用dplyr+broom包为我的每个子组运行单独的回归

(实际数据是受限访问,不能在这里分享)

我收到以下错误:

如果我理解正确,这意味着无法对某些子组运行回归,可能是由于某些变量中的所有 NA。

我怎样才能捕捉到这些错误,以便最终我收到一个数据集,其中包含回归成功运行的子组的回归输出?

编辑:尝试了类似于评论中建议的链接的语法并遇到了同样的问题:

lm.fit(x,y,offset = offset,singular.ok =singular.ok,...)中的错误:0(非 NA)案例

0 投票
1 回答
1964 浏览

r - 在 purrr 中处理不同长度的向量

我目前有以下R代码运行具有不同预测变量、跨不同子集的多个回归模型,并使用broom包返回整理后的输出。

这将产生以下数据框:

在不使用循环函数的情况下将结果向量(例如outcomes<-c("mpg", "qsec"))合并到此脚本中的最佳方法是什么?我已经考虑过包中的map2_df函数,purrr但它要求两个向量的长度相同。我想要的数据框如下所示:

0 投票
3 回答
1456 浏览

r - 使用 ggplot2 绘制具有多个子多边形和孔的 SpatialPolygons

我想SpatialPolygonsspggplot2 中有孔的库中绘图。感谢其他关于stackoverflow的问题,我知道在处理顺时针书写的多边形时这是允许的:
http
://stackoverflow.com/questions/12047643/geom-polygon-with-multiple-hole/12051278#12051278 事实上,当转换一个SpatialPolygons使用broom::tidy(替换ggplot2::fortify),孔多边形按顺时针方向保存以绘制为孔。
在 ggplot2 中,绘制带孔的多边形的方式强制使用 绘制它们一次fill,然后使用 绘制它们colour,否则您可能会看到线穿过多边形。当处理多个子多边形时,有些带有孔,这更棘手,点特征的顺序定义为broom::tidy可能不允许填充多边形(见下图)。
你们中的任何人都有摆脱这种填充问题行为的解决方案吗?

这是一个可重现的示例:

带有孔的SpatialPolygons的ggplot填充问题
(来源:statnmap.com

0 投票
0 回答
352 浏览

r - 如何在 spark 数据帧上使用 sparklyr 与在 R 数据帧上使用 dplyr 获得相同的结果?

以下代码计算三个因变量中的每一个的一组回归系数,这些因变量在两组中的每一个的六个自变量的集合上回归,并且工作正常。

我想使用 spark 数据框而不是 R 数据框来复制相同的逻辑。例如,类似于以下内容:

此代码失败主要是因为我需要使用“ml_linear_regression”而不是“lm”,但即使进行替换它也会失败。如果我保留“ml_linear_regression”,但删除 cbind() 并仅保留一个因变量,则计算一些系数,尽管 broom::tidy 无法获取系数。

有没有办法在 sparklyr 框架中产生这个结果,或者如果需要的话,用另一种方法?

0 投票
1 回答
856 浏览

r - modelr::bootstrap 或 broom::bootstrap 和分组问题

我有一个长数据集,它由多个插补产生的几个数据集组成(比如说 10 个插补)。他们有一个标识插补的 id 变量。在每个估算的数据集上,我想引导 10 个数据集。在引导之后,我想在每个(100 个,插补引导组合)上运行模型。

在这个例子中,我不确定是使用broom::bootstrap()函数还是modelr::bootstrap()函数。此外,分组似乎在我的管道中丢失了。

这是使用 mtcars 数据集的可重现示例:

正如您所看到的,输出当前显示有两个组,这是应该的。在我的数据集中,它会显示每个估算数据集有 10 个。现在:

现在看起来好像只有 10 个组代表每个重复。它似乎没有保留先前的分组。在这一点上,我预计总共有 20 个组(2 x 10)。

如果我现在这样做:

现在似乎没有复制只有组am

在我对原始数据集进行分组,无论如何都要进行引导。此外,理想情况下,在我引导之后,应该有一个 id 指示我正在查看哪个引导数据集。

在我的理想世界中,我的代码应该能够执行以下操作:

0 投票
1 回答
1780 浏览

r - 在列表列中使用 lm 使用 purrr 预测新值

我正在尝试将一列预测添加到具有包含 lm 模型的列表列的数据框中。我采用了这篇文章中的一些代码。

我在这里做了一个玩具例子:

这给了我一个看起来像这样的小标题:

要使用特定组的 lm 模型获得预测值,我可以使用以下方法:

产生这个结果:

我想为每一组做一个新的预测。我尝试使用 purrr 来获得我想要的东西:

但这给出了以下错误:

我能够通过以下怪物获得我想要的结果:

这给了我一个看起来像这样的小标题:

一定有办法以“整洁”的方式做到这一点,但我就是无法破解它。