我目前在将大量数据组合成面板数据时遇到问题。我发现这个解决方案可以帮助我获得“更小”的解决方案:面板数据,但我无法将其应用于“更大”的格式。
我将尝试制作一个编码示例:来自包'datasets':
df_1 = WorldPhones # In my case, years 2000-2014 and 43 columns (districts)
df_2 = WorldPhones # In my case, there is different data here
df_3 = WorldPhones # ""
df_4 = WorldPhones # ""
每个数据框包含 43 个地区中每个地区的不同值。我给每个地区一个唯一的 id(1 到 43)。这 43 个地区与数据集 WorldPhones 中给出的 7 个地区(大洲)相当。每个数据框仅包含每个地区和每年的一个变量。假设 df_1 包含变量 X1,df_2 包含 X2 等等。我想把这些数据变成“长”格式,这样想:
Id Year X1 X2 X3 ...
1 1951 45939 21574 2876
1 1956 60423 29990 4708
1 1957 64721 32510 5230
1 1958 68484 35218 6662
1 1959 71799 37598 6856
1 1960 76036 40341 8220
1 1961 79831 43173 9053
2 1951 45939 21574 2876
2 1956 60423 29990 4708
2 1957 64721 32510 5230
2 1958 68484 35218 6662
2 1959 71799 37598 6856
2 1960 76036 40341 8220
2 1961 79831 43173 9053
...
43 1951 45939 21574 2876
43 1956 60423 29990 4708
43 1957 64721 32510 5230
43 1958 68484 35218 6662
43 1959 71799 37598 6856
43 1960 76036 40341 8220
43 1961 79831 43173 9053
不幸的是,我真的不知道该怎么做,除了“蛮力”,它会写下“它”43次。