所以我有一个 Pandas DF,其中有许多需要日期时间的日期字段,所以我有以下工作,但知道它是糟糕的 Python,至少每个字段循环整个 DF 一次,并且 df 是 410,000 行。
table.index=pd.to_datetime(table.index) #not sure why it does not come in as datetime?
table['STATUS_DATE']=pd.to_datetime(table['STATUS_DATE'])
table['DATE_MODIFIED']=pd.to_datetime(table['DATE_MODIFIED'])
table['SOLD_DATE']=pd.to_datetime(table['SOLD_DATE'])
table['WITHDRAWN_DATE']=pd.to_datetime(table['WITHDRAWN_DATE'])
table['END_DATE']=table[['DATE_MODIFIED', 'STATUS_DATE','SOLD_DATE','WITHDRAWN_DATE']].min(axis=1)
table['SUBDIVISION'].replace(df3['NSUBDIVISION'],inplace=True)
table['CALC_DOM']=table.index # there should be a single line version???
table['CALC_DOM']=table['END_DATE']-table['CALC_DOM']
我想循环一次df并转换所有字段?欢迎提出建议 我刚刚开始能够写一些这样的东西,但想学会正确地做,而不是我上面那些丑陋的东西。