问题标签 [broom]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 拟合一系列线性模型以分离不同分组变量的因变量
嗨:我有六个连续因变量和三个国家/地区的一个自变量。我想看看每个国家的 y1 到 y6 ~ x1 的系数是多少。有没有办法用 dplyr 和 broom 巧妙地做到这一点?我对 dplyr 相当了解,但对扫帚很陌生。
r - 如何从 R 中的线性模型中提取特定的残差数据
我将如何在以下线性模型中提取特定棒球队的提取残差数据?例如,我将如何提取“CLE”的残差?
r - 一系列线性模型的预测值
您好:我在使用 tidyr 和 dplyr 构建的数据框中有一系列线性模型。它看起来像下面。我将如何使用一组固定的新数据从每个模型生成预测值?实际上我有 10 个因变量,但只有两个自变量
r - 使用 dplyr 或 reshape2 跨数据帧多列的卡方统计
我有一个关于使用dplyr
和reshape2
计算跨多列的卡方统计数据的问题。下面是一个小数据框...
我将如何使用summarise_each
或melt
计算Sat
针对每个其他变量的列以生成卡方残差和 p 值统计信息。我想一定有类似的东西:
但我不知道如何完成它。另外,我将如何融化数据框并使用group_by
或do()
获取卡方统计信息?我有兴趣看到这两种方法。如果有一种方法可以合并broom
包,那也很好,或者tidyr
代替reshape2
.
回顾一下,我想运行卡方检验,例如
但是...我想针对 、 和 的变量生成卡方统计Sat
数据。这是一个小例子,我希望上面的方法能够让我以快速有效的方式跨多列创建卡方统计数据。如果我可以用 绘制热图中的残差,那就太好了,这就是我有兴趣将包合并到这个例子中的原因。Gender
Ethnicity
AgeGroup
ggplot2
broom
r - R ttest 使用 tidy 循环分组变量
我已经看到了与此非常相似的问题,但仍然无法解决这个简单的问题。
我想对分组变量运行配对 t 检验并将结果存储在数据框中。tidy
包中的命令broom
执行此操作,但是当我运行下面的代码时,每个时间点的输出都是相同的。我知道我可以使用循环来做到这一点,但我想在tidy
这里使用并了解正在发生的事情。
这是一个可重现的示例:
每个时间点的结果输出都是相同的:
我确信有一个简单的解决方法,但不确定它是什么,任何建议都会很棒。谢谢
r - 使用增强提取对新水平数据集的预测
我正在按组/级别对数据进行回归。所以每个级别都有一个 reg,即我的代码看起来与此非常相似:
如何在具有相同组的较小新数据集上提取预测?即水平相同但样本较小。我想一次对所有级别的新数据集进行预测。我知道扫帚中的“增强”可以为您提供预测。但我不知道如何同时为所有级别做到这一点。
我使用的代码如下所示。
我也试过
它给出了拟合值,但复制了我的新数据以匹配原始数据,但每个观察的预测都不同。我的数据有 44 个级别,我必须做更多。非常感谢您的帮助。
r - 如何从 lme4::lmer() 使用 broom::tidy() 创建的线性混合效应模型计算 p 值?
我使用包中的lmer()
函数构建了一个混合效果模型lme4
。出于某种良好的哲学原因,该lme4
软件包不输出系数的 p 值。但是,我仍然需要 p 值在我的出版物中报告。我知道有多种方法可以使用由创建的模型计算 p 值lmer()
,例如这里。
我的问题是:我想使用包中的tidy()
函数提取 p 值broom
。在这里,我真的很想坚持下去,tidy()
因为我想维护以下管道:
一种选择是创建一个自定义函数并将其附加到管道中。但是,broom
包的手册页(http://rpackages.ianhowson.com/cran/broom/man/lme4_tidiers.html)说:
通过这个,我假设一个从 lmer 模型给出的 t 值计算 p 值的函数已经在 broom 中实现。所以,我不愿意重新发明轮子。
问题是我根本没有得到名为 p.value 的列。我期待一个名为 p.value 的列,其中 NA 是最坏的情况。
代码:
输出:
r - do/tidy 从 dplyr 和 broom 返回的绑定列未按预期工作
我正在尝试使用do
fromdplyr
和tidy
frombroom
将一些东西整齐地组织到数据框中。一切正常。但是,现在我试图根据同一管道内的分组来改变一个值,但我不能让它为我想要的工作:
示例(带有mtcars
数据集):
我希望得到summary
per cyl 的输出以及我在中间计算的观察次数。但是,我只得到summary
如下输出:
n
缺少输出值。
我也尝试过bind_cols
,inner_join
如下所示,两者都导致错误如下所示:
知道我怎样才能完成这项工作吗?
我的预期输出是:
当然,我可以这样做得到这个结果:
但是,寻找单管解决方案(如果可能)。
r - 有什么方法可以将 rma() 输出与 broom 包一起使用?
我正在做元分析研究并且非常喜欢 R 中的 metafor 包。但是,为了能够利用 R 可以做的所有伟大的事情,例如在嵌套的 data.frame 中管理许多不同的模型(感谢 Hadley Wickham 和 David Robinson)我需要能够将 metafor 包 rma()-models 的输出与扫帚一起使用。
有人现在如何做到这一点。我知道扫帚(还)不支持开箱即用的事实,但非常感谢到目前为止的解决方法。
非常感谢!
r - 使用 dplyr 进行条件线性拟合
我正在尝试在分组数据中进行线性拟合。
但是,我还想在整个拟合过程中添加一些条件,但是当我对某些条件进行子集化时没有这样做。
我在每个组内的条件是
1)如果所有最后 3 个value==0
仅在V>=4&V<=5
2)如果最后 2value>0
只适合V>=7
.
这是我为执行此操作而编写的函数
最后我想得到每组的斜率值。
是否有捷径可寻?
提前谢谢了!