问题标签 [broom]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何在来自两个数据帧的分组值之间执行操作
我有两个数据框:
我想要做的是对两个数据框中按分组的列执行操作( ks.test()
) 。例如,S1 和 P1 的 KS 检验的 p 值为:score
Sample_name
我想要做的是对所有操作执行所有操作,以便最终得到这样的表
我怎样才能做到这一点?最好是快速的,因为其中的样本数量ref_table
可能很大(P1,P2 .... P10k)。
r - GLM 解析分类系数
我正在尝试创建整洁的数据,并且正在尝试将章程值与字段名称分开
有没有办法将 first_letter 和 C 分开?
我想在数据框中使用估计值、术语和字符以供将来使用。任何帮助,将不胜感激!
r - 如何使用 broom 和 dplyr 在多列上拟合分布
我有以下数据:
我可以这样计算列 X:
我怎样才能对所有列(除了第一个 - genes
)执行此操作,以便最终我得到:
r - 如何基于对数正态参数构造向量
我有以下向量:
我可以得到以下参数:
我的问题是如何创建与使用上述参数bar
相同长度的新向量(我们称之为) ?foo
我试过这个(很可能是错的):
r - 扫帚,子组的回归:如何处理 reg 子组中的错误?
我正在使用dplyr
+broom
包为我的每个子组运行单独的回归
(实际数据是受限访问,不能在这里分享)
我收到以下错误:
如果我理解正确,这意味着无法对某些子组运行回归,可能是由于某些变量中的所有 NA。
我怎样才能捕捉到这些错误,以便最终我收到一个数据集,其中包含回归成功运行的子组的回归输出?
编辑:尝试了类似于评论中建议的链接的语法并遇到了同样的问题:
lm.fit(x,y,offset = offset,singular.ok =singular.ok,...)中的错误:0(非 NA)案例
r - 在 purrr 中处理不同长度的向量
我目前有以下R
代码运行具有不同预测变量、跨不同子集的多个回归模型,并使用broom
包返回整理后的输出。
这将产生以下数据框:
在不使用循环函数的情况下将结果向量(例如outcomes<-c("mpg", "qsec")
)合并到此脚本中的最佳方法是什么?我已经考虑过包中的map2_df
函数,purrr
但它要求两个向量的长度相同。我想要的数据框如下所示:
r - 使用 ggplot2 绘制具有多个子多边形和孔的 SpatialPolygons
我想SpatialPolygons
从sp
ggplot2 中有孔的库中绘图。感谢其他关于stackoverflow的问题,我知道在处理顺时针书写的多边形时这是允许的:
http
://stackoverflow.com/questions/12047643/geom-polygon-with-multiple-hole/12051278#12051278
事实上,当转换一个SpatialPolygons
使用broom::tidy
(替换ggplot2::fortify
),孔多边形按顺时针方向保存以绘制为孔。
在 ggplot2 中,绘制带孔的多边形的方式强制使用 绘制它们一次fill
,然后使用 绘制它们colour
,否则您可能会看到线穿过多边形。当处理多个子多边形时,有些带有孔,这更棘手,点特征的顺序定义为broom::tidy
可能不允许填充多边形(见下图)。
你们中的任何人都有摆脱这种填充问题行为的解决方案吗?
这是一个可重现的示例:
(来源:statnmap.com)
r - 如何在 spark 数据帧上使用 sparklyr 与在 R 数据帧上使用 dplyr 获得相同的结果?
以下代码计算三个因变量中的每一个的一组回归系数,这些因变量在两组中的每一个的六个自变量的集合上回归,并且工作正常。
我想使用 spark 数据框而不是 R 数据框来复制相同的逻辑。例如,类似于以下内容:
此代码失败主要是因为我需要使用“ml_linear_regression”而不是“lm”,但即使进行替换它也会失败。如果我保留“ml_linear_regression”,但删除 cbind() 并仅保留一个因变量,则计算一些系数,尽管 broom::tidy 无法获取系数。
有没有办法在 sparklyr 框架中产生这个结果,或者如果需要的话,用另一种方法?
r - modelr::bootstrap 或 broom::bootstrap 和分组问题
我有一个长数据集,它由多个插补产生的几个数据集组成(比如说 10 个插补)。他们有一个标识插补的 id 变量。在每个估算的数据集上,我想引导 10 个数据集。在引导之后,我想在每个(100 个,插补引导组合)上运行模型。
在这个例子中,我不确定是使用broom::bootstrap()
函数还是modelr::bootstrap()
函数。此外,分组似乎在我的管道中丢失了。
这是使用 mtcars 数据集的可重现示例:
正如您所看到的,输出当前显示有两个组,这是应该的。在我的数据集中,它会显示每个估算数据集有 10 个。现在:
现在看起来好像只有 10 个组代表每个重复。它似乎没有保留先前的分组。在这一点上,我预计总共有 20 个组(2 x 10)。
如果我现在这样做:
现在似乎没有复制只有组am
。
在我对原始数据集进行分组后,无论如何都要进行引导。此外,理想情况下,在我引导之后,应该有一个 id 指示我正在查看哪个引导数据集。
在我的理想世界中,我的代码应该能够执行以下操作:
r - 在列表列中使用 lm 使用 purrr 预测新值
我正在尝试将一列预测添加到具有包含 lm 模型的列表列的数据框中。我采用了这篇文章中的一些代码。
我在这里做了一个玩具例子:
这给了我一个看起来像这样的小标题:
要使用特定组的 lm 模型获得预测值,我可以使用以下方法:
产生这个结果:
我想为每一组做一个新的预测。我尝试使用 purrr 来获得我想要的东西:
但这给出了以下错误:
我能够通过以下怪物获得我想要的结果:
这给了我一个看起来像这样的小标题:
一定有办法以“整洁”的方式做到这一点,但我就是无法破解它。