问题标签 [tapply]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1081 浏览

r - 为什么 tapply 将子集作为 NA 而不是完全排除它们

我有个问题。我想用平均值和误差线制作一个条形图,其中它被分组为两个因素。为了获得平均值和标准误差,我使用了函数 tapply。

但是,对于其中一个因素,我想降低一个级别。

所以我所做的是:

然后为了得到平均误差和标准误差,我使用这个:

并且发生了一些奇怪的事情,它不计算 FS,但是它把它放在一个带有 NA 的表中:

这是我不想要的,因为如果我在 barplot2(包 gplots)中使用它,那么我会得到一个 FS 的空栏,而那个根本不应该在那里。

任何使用都有解决方案或其他方法来获得漂亮的条形图:)。不管怎么说,还是要谢谢你!

0 投票
2 回答
506 浏览

r - 整形台的性能

我怎样才能从这样的表中走出来:

对这样的人?我尝试使用 reshape2 包中的 dcast。它工作正常,但由于数据集很大,所以有点慢。有没有另一种方法可以更快地做到这一点?

谢谢!

0 投票
2 回答
415 浏览

r - 向量化 glm 并提取所有信息

我有一个包含多个组的数据集“关键字”。我想将 glm 单独应用于每个组,以创建一个 glm 列表适合每个组。

我可以用for循环来做到这一点,但这不是 R 精神。相反,我尝试使用by函数来做到这一点:

问题是虽然glm通常返回一个 glm 类对象,我可以从中提取各种好东西,但返回一个列表

除拟合参数外,所有信息均已丢失。有没有办法强制保留有关列表的所有信息?

ps,我尝试使用plyr工具箱,但它卡住了,因为我的关键字中有空格。

pps,这篇文章应该有标签“by”,但我无法创建该标签(stackoverflow 的新标签),有人可以重新标记它吗?

0 投票
4 回答
246 浏览

r - 如何将计数器分配给由因子组合定义的 data.frame 的特定子集?

我的问题是:我有一个包含一些因子变量的数据框。我现在想为这个数据框分配一个新向量,它为这些因子变量的每个子集创建一个索引。

给了我类似的东西:

我想要的是一个组合计数器,它计算每个因素组合的出现。像这样

到目前为止,我考虑过使用 tapply 来获取所有因子组合的计数器,效果很好

但我不知道如何在不使用低效循环的情况下将计数器列表(例如未列出)分配给数据帧中的组合:)

0 投票
1 回答
410 浏览

r - 带有有序因子的 tapply

当缺少因子水平时,您可以通过以下方式使用表:

这将返回一个以零频率列出的级别为“2”的表。

如果有一组与“分数”相关联的“分数”并且没有缺失的级别(这里是 2),tapply则可以用于生成每个级别的分数总和。

tapply 可以适应“缺失”因子水平的情况吗?或者,还有更好的方法?

0 投票
1 回答
109 浏览

r - week day week-percent from time-series

我有一些每日时间序列数据,我需要提取相对于一周平均值的“工作日百分比”。例如,如果第一周有mean = 100并且本周的星期日值为 20,则星期日变为 0.2。

这是一些随机数据:

我需要一个名为 的新列pecent,即上面解释的值。我尝试添加一些列然后使用tapply,但失败了。感谢任何帮助!

0 投票
2 回答
180 浏览

r - by() 函数是否使列表不断增长

该函数是否会by创建一个一次增长一个元素的列表?

我需要处理一个数据框,其中包含按因子列分组的大约 4M 观察值。情况类似于下面的例子:

现在,tapply其中一个列上的 a 需要合理的时间:

但如果我这样做:

这不会在同一时间完成(我在一分钟后放弃了)。

当然,在上面的例子中,tapply可以使用,但我实际上需要将多个列一起处理。这样做的更好方法是什么?

0 投票
2 回答
28701 浏览

r - 如何将 na.rm 作为参数传递给 tapply?

我想从一个数据框中计算平均值和标准差,其中一列用于参数,一列用于组标识符。使用时如何计算它们tapply?我可以使用sd(v1, group, na.rm=TRUE),但在使用时无法将其na.rm=TRUE放入语句中tapplyomit.na是没有选择的。我有一大堆参数,并且在排除所有具有一个缺失值的行时,必须逐步完成它们而不会丢失一半的数据帧。

声明也是如此by

任何想法如何完成这项工作?

0 投票
0 回答
114 浏览

r - winbugs中tapply的对应物

我需要计算每个状态的平均值。在 R 中,我通过使用

tapply(y,state,mean).

这是一个例子:

其中 y 表示拟合值的向量,state 表示作为因子的因变量。

我想知道如何在 Winbugs 中做到这一点。有人对此有任何想法吗?

0 投票
1 回答
491 浏览

r - 在 R 的数据框中使用 tapply 函数

这是我的数据框df:

1 1 1
2 1 2
3 2 3

我得到了结果:

2
3

使用代码:

tapply(df$y, df$x, sum)

但我希望得到

3
3

我的代码有问题吗?