我正在写一篇经济学论文,需要一些帮助来组合和转换两个数据集。
我有两个熊猫数据框,一个带有国家列表及其邻国(borderdf),例如
borderdf
country neighbor
sweden norway
sweden denmark
denmark germany
denmark sweden
一个带有每个国家和年份的数据(datadf),例如
datadf
country gdp year
sweden 5454 2004
sweden 5676 2005
norway 3433 2004
norway 3433 2005
denmark 2132 2004
denmark 2342 2005
我需要在 datadf 中为 neighbormeangdp 创建一个列,该列将包含所有邻居的 gdp 的平均值,由 neighbordf 给出。我希望我的结果看起来像这样:
datadf
country year gdp neighborsmeangdp
sweden 2004 5454 5565
sweden 2005 5676 5775
我该怎么做呢?