2

可以说我有data.table这些列

nodeID   
hour1aaa   
hour1bbb   
hour1ccc   
hour2aaa   
hour2bbb   
hour2ccc   
...   
hour24aaa   
hour24bbb   
hour24ccc

总共 72 列。让我们称之为rawtable

我想重塑它,所以我有

nodeID
hour
aaa
bbb
ccc

总共只有这 5 列,其中小时列将包含原始 72 中的任何一个小时。让我们称之为newshape

我现在这样做的方式是使用rbindlist24 个项目,其中每个项目都是更大 data.table 的正确子集。像这样(除了我在我的例子中大部分时间都没有)

newshape<-rbindlist(list(
 rawtable[,list(nodeID, Hour=1, aaa=hour1aaa, bbb=hour1bbb, ccc=hour1ccc)], 
 rawtable[,list(nodeID, Hour=2, aaa=hour2aaa, bbb=hour2bbb, ccc=hour2ccc)], 
 rawtable[,list(nodeID, Hour=24, aaa=hour24aaa, bbb=hour24bbb, ccc=hour24ccc)]))

这是一些可以使用的示例数据

rawtable<-data.table(nodeID=c(1,2),hour1aaa=c(12.4,32),hour1bbb=c(61.1,65.33),hour1ccc=c(-4.2,54),hour2aaa=c(12.2,1.2),hour2bbb=c(12.2,5.7),hour2ccc=c(5.6,101.9),hour24aaa=c(45.2,8.5),hour24bbb=c(23,7.9),hour24ccc=c(98,32.3))

使用我的rbindlist方法可以得到想要的结果,但是就像我用 R 做的大多数事情一样,可能有更好的方法。更好是指内存效率更高、速度更快和/或使用更少的代码行。有没有人有更好的方法来实现这一目标?

4

2 回答 2

3

reshape如果你的名字符合它所期望的标准约定,这是一个经典问题,尽管我不确定这是否真的利用了data.table结构的效率:

reshape(
  setNames(rawtable, gsub("(\\D+)(\\d+)(\\D+)", "\\3.\\2", names(rawtable))),
  idvar="nodeID", direction="long", varying=-1
)

结果:

   nodeID hour  aaa   bbb   ccc
1:      1    1 12.4 61.10  -4.2
2:      2    1 32.0 65.33  54.0
3:      1    2 12.2 12.20   5.6
4:      2    2  1.2  5.70 101.9
5:      1   24 45.2 23.00  98.0
6:      2   24  8.5  7.90  32.3

@Arun在这里的答案:https ://stackoverflow.com/a/15510828/496803如果您可以根据当前数据调整它也可能很有用。

于 2013-08-19T23:37:28.487 回答
2

一种选择是merged.stack从我的包“splitstackshape”中使用。这个函数,stacks 组列,然后将输出合并在一起。由于函数如何创建“时间”变量,您可以指定要从列名中删除的任何内容。在这种情况下,我们想去掉“hour”、“aaa”、“bbb”和“ccc”,只剩下剩下的数字。

library(splitstackshape)
## Make sure you're using at least 1.2.0
packageVersion("splitstackshape")
# [1] ‘1.2.0’
merged.stack(rawtable, id.vars="nodeID", 
             var.stubs=c("aaa", "bbb", "ccc"), 
             sep="hour|aaa|bbb|ccc")
#    nodeID .time_1  aaa   bbb   ccc
# 1:      1       1 12.4 61.10  -4.2
# 2:      1       2 12.2 12.20   5.6
# 3:      1      24 45.2 23.00  98.0
# 4:      2       1 32.0 65.33  54.0
# 5:      2       2  1.2  5.70 101.9
# 6:      2      24  8.5  7.90  32.3
于 2013-08-20T02:22:20.940 回答