我希望这个问题很清楚,但我正在调查 Zillow 房屋销售数据,并且遇到了一个问题,能够将某些年份的所有月份合并到一个新声明的“年份”变量。这实际上应该将所有具有 Jan-YY、Feb-YY、Mar-YY 等的数据存储到 YY 中。
我试过 Pandas 内置的Stack()和Pivot()等函数,但这些似乎都不起作用。
如果没有可行的方法来做到这一点,我的选择是什么?提前致谢!
示例:取 Column1 = '1/31/1996'和 Column2 = '2/28/1996' ...等。和 Column12 = '12/31/1996'并组合成一个名为Y1996的新列。这将比每月细分更容易分析。
我的代码:
import pandas as pd
import numpy as np
import statsmodels.api as sm
import matplotlib.pyplot as plt
%matplotlib inline
zil = pd.read_csv('zillow.csv')
df_zil = pd.DataFrame(df_zil)
df_zil.head(4)
#My attempt at merging into one
y1996 = (df_zil['1/31/1996'] + df_zil['3/31/1996'] + df_zil['4/30/1996'] + df_zil['5/31/1996'] +
df_zil['6/30/1996'] + df_zil['7/31/1996'] + df_zil['8/31/1996'] + df_zil['9/30/1996'] +
df_zil['10/31/1996'] + df_zil['11/30/1996'] + df_zil['12/31/1996'])
参考 Zillow 数据:https ://www.zillow.com/research/data/