我有一个带有 3 个变量和 1.425.558 个观察值的 data.frame。它是可再生能源工厂安装电力的登记册。每行代表一个已安装的发电厂。在一个邮政编码区域内可以有多个相同类型的发电厂。
ID zipcode Type power
1 79280 solarpower 3
2 79280 solarpower 3
3 79283 hydroelectric 3
4 79280 biogas 55
5 79280 windpower 2
6 21459 windpower 4
7 21459 windpower 2
我想通过邮政编码总结安装了多少太阳能/沼气/风力发电。
zipcode Type power
21459 windpower 6
79280 solarpower 6
79280 windpower 2
...and so on.
我已经试过了
aggregate(myDat$power, by=list(myDat$zipcode,myDat$type), FUN=sum)
但我的内存不够用。
我知道,我的数据框非常大。我可以缩小很多,因为我只需要那些以“2”开头的邮政编码的数据。
你能给我指出一个解决方案吗?非常感谢您对初学者的帮助!