我正在处理一个简单的表格
date variable value
1970-01-01 V1 0.434
1970-01-01 V2 12.12
1970-01-01 V3 921.1
1970-01-02 V1 -1.10
1970-01-03 V3 0.000
1970-01-03 V5 312e6
... ... ...
对(日期,变量)是唯一的。我想把这张桌子变成一张宽幅桌子。
date V1 V2 V3 V4 V5
1970-01-01 0.434 12.12 921.1 NA NA
1970-01-02 -1.10 NA NA NA NA
1970-01-03 0.000 NA NA NA 312e6
而且我想以最快的方式做到这一点,因为我必须在具有 1e6 条记录的表上反复重复该操作。tapply()
在 R 原生模式下,我相信reshape()
和d*ply()
都在速度方面由data.table
. 我想针对基于 sqlite 的解决方案(或其他数据库)测试后者的性能。以前有这样做过吗?有性能提升吗?而且,当“宽”字段(日期)的数量是可变的并且事先不知道时,如何在 sqlite 中将高到宽转换?