我想从尚不适合创建协方差矩阵的数据框中创建协方差矩阵。
使用 RPostgreSQL 查询数据库后,我有以下类型的数据框:
pg_id item_id value date
1 67808755896 23.5 2016-11-12
2 223337345 0 2016-11-12
3 254337000000 1 2016-11-12
4 34604777037 0 2016-11-12
5 142223438000 14.3 2016-11-12
6 170555690000 22 2016-11-12
整个数据框有约 500 000 行,大约有 16 000 个 item_id。item_id 是重复的(在这里回顾几个月)。
我最终要做的是为 item_id 的值创建一个协方差矩阵。
为此,作为第一步,我想重新排列数据框,最终得到如下所示的数据框:
item_id
date 67808755896 223337345 254337000000 ...
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
我的问题是,我不知道以我需要的方式重新排序数据框的方法。
如果有一个 SQL 查询可以让我在检索时选择获得所需的结构,我想那将是最好的。
在 RI 中尝试了一些使用 melt 和 spread 的方法,但是对于我的本地 mac 来说,计算似乎太重了,我上次尝试它时只是在某个时候关闭了。
提前感谢您的帮助!