我找不到令人满意的教程来解释我如何使用应用函数的所有可能性。我仍然是一个新手,但这通常可以派上用场并显着简化我的代码。所以这是我的例子......我有一个看起来像这样的数据框:
> head(p01)
time key dwell
1 8.13 z 0.00
3 8.13 x 1.25
5 9.38 l 0.87
7 10.25 x 0.15
9 10.40 l 1.13
11 11.53 x 0.45
将其放入 R:
p01 <- structure(list(time = c(8.13, 8.13, 9.38, 10.25, 10.4, 11.53),
key = c("z", "x", "l", "x", "l", "x"), dwell = c(0, 1.25,
0.869, 0.15, 1.13, 0.45)), .Names = c("time", "key", "dwell"), row.names = c(1L, 3L, 5L, 7L, 9L, 11L), class = "data.frame")
现在我想计算每个字母的出现次数p01$key
并将它们打印在 中p01$occurences
,这样结果将如下所示:
time key dwell occurences
1 8.13 z 0.00 1
3 8.13 x 1.25 3
5 9.38 l 0.87 2
7 10.25 x 0.15 3
9 10.40 l 1.13 2
11 11.53 x 0.45 3
我现在的做法是:
p01[p01$key == "l", "occurences"] <- table(p01$key)["l"]
p01[p01$key == "x", "occurences"] <- table(p01$key)["x"]
p01[p01$key == "z", "occurences"] <- table(p01$key)["z"]
...这当然不是最好的解决方案。p01$key
特别是因为真实数据在(16 个不同字母之一)中包含更多可能性。
最重要的是,我想计算dwell
每个字母的总数,所以我现在正在做的是:
p01[p01$key == "l", "total_dwell"] <- tapply(p01$dwell, p01$key, sum)["l"]
p01[p01$key == "x", "total_dwell"] <- tapply(p01$dwell, p01$key, sum)["x"]
p01[p01$key == "z", "total_dwell"] <- tapply(p01$dwell, p01$key, sum)["z"]
为了得到:
time key dwell total_dwell
1 8.13 z 0.00 0.00
3 8.13 x 1.25 1.85
5 9.38 l 0.87 2.00
7 10.25 x 0.15 1.85
9 10.40 l 1.13 2.00
11 11.53 x 0.45 1.85
在过去的 6 个小时里,我一直在谷歌上搜索并浏览了几本书。非常感谢一个优雅的解决方案和/或一些综合教程的链接。我的解决方案显然有效,但这不是我第一次必须解决这样的问题,而且我的脚本文件开始看起来很荒谬!