我正在研究项目的另一个方面,但使用从 Mesowest 下载的 csv 文件进行实验。新代码是
df_pirates_all = pd.read_csv(
"https://cdn.touringplans.com/datasets/pirates_of_caribbean_dlr.csv",usecols=['date','datetime','SPOSTMIN'],
parse_dates=['date', 'datetime'],
)
df_pirates_all['ride'] = 'pirates'
df_pirates_all['open'] = ~((df_pirates_all['SPOSTMIN'] == -999))
df_pirates = df_pirates_all.set_index('datetime').sort_index()
df_pirates = df_pirates.loc['2017-01-01 06:00':'2017-02-01 00:00']
c = df_pirates.groupby(level=0).transform("count")
c[c["date"]>1].index.tolist()
df_pirates = df_pirates[~df_pirates.index.isin(c[c["date"]>1].index.tolist())].resample('10Min').fillna("nearest",limit=1)
wxdataadd="C:/Users/stratus/Downloads/DisneyJanuary2017Wx.csv"
wx=pd.read_csv(wxdataadd)
wxdata=wx.resample('10Min')
temp=wxdata['air_temp_set_1']
time=wxdata['Date_Time']
wxtest=pd.concat([df_pirates, temp,time])
wxtest=wxtest.set_index([df_pirates,temp]).unstack()
print (wxtest)
但是我得到了一个
TypeError: Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex, but got an instance of 'RangeIndex'
关于天气数据的重新采样,因为 wxdata 在列中有值:
Index(['Date_Time', 'air_temp_set_1', 'relative_humidity_set_1',
'wind_speed_set_1', 'wind_direction_set_1', 'wind_gust_set_1',
'precip_accum_since_local_midnight_set_1'],
dtype='object')
当我想将其设置为每 10 分钟甚至 15 分钟以与骑行数据很好地对齐时,每 5 分钟一次。