r - R：在多个因素/水平上进行计算（虚拟变量）

Question

我有两个同样长的时间序列数据匹配向量：价格（x）和小时（h）。小时从 0 到 23。我的小时变量是我的虚拟变量（或因子/水平变量，我猜它在 R 中被调用）。

现在我已经定义了 24 个不同的虚拟变量，并且每个小时我都输入我的虚拟变量。因此，例如生成 24 个图来查看或计算 24 个均值等，我将键入：plot.ts(hour1) # 以此类推所有 24 个。

我想尽可能轻松地为所有 24 个变量执行此操作吗？所以我可以运行很多不同的计算。例如，我怎么能只计算所有 24 个虚拟变量的平均值而不编写 24 行代码来更改每个虚拟变量？

编辑：对不起，认为这两个向量很清楚。例子：

 1. Price Hour
 2. 8     0
 3. 12    1
 4. 14    2
 5. 16    3
 6. 18    4
 7. 20    5
 8. 22    6
 9. 24    7
 10. 26   8
 11. 28   9
 12. 24   10
 13. 26   11
 14. 23   12
 15. 23   13
 16. 23   14
 17. 14   15
 18. 19   16
 19. 25   17
 20. 26   18
 21. 28   19
 22. 30   20
 23. 33   21 
 24. 24   22
 25. 10   23
 26. 14   0
 27. 12   1
 28. 13   2
 29. x    ect.

score 2 · Accepted Answer

由于您没有给出可重复的示例，因此尚不清楚您的数据是如何存储的。我假设您每个小时都有单独的变量1。

通常，最好将hourxx变量放在列表中以执行计算。

例如，这将计算所有小时的平均值：

    lapply(lapply(ls(pattern='hour.*'),get),mean)

OP澄清后编辑：

您应该创建一个新变量来区分小时间隔。就像是：

dat <- data.frame(Price=rnorm(24*5),Hour=rep(0:23,5))
dat$id <- cumsum(c(0,diff(dat$Hour)==-23))

然后使用ply包例如，您可以通过 id 计算平均值：

library(plyr)
ddply(dat,.(id),summarise,mPrice=mean(Price))

 id     mPrice
1  0  0.2999602
2  1 -0.2201148
3  2  0.2400192
4  3 -0.2087594
5  4  0.1666915

r - R：在多个因素/水平上进行计算（虚拟变量）

1 回答 1

Related

Reference