我在为我的 pandas 数据框获取正确的时间索引时遇到了一些麻烦。
import pandas as pd
from datetime import strptime
import numpy as np
stockdata = pd.read_csv("/home/stff/symbol_2012-02.csv", parse_dates =[[0,1,2]])
stockdata.columns = ['date_time','ticker','exch','salcond','vol','price','stopstockind','corrind','seqnum','source','trf','symroot','symsuffix']
我认为问题在于时间的东西出现在前三列:年/月/日、小时/分钟/秒、毫秒。此外,如果在中午之前,小时/分钟/秒列会删除第一个零。
print(stockdata['date_time'][0])
20120201 41206 300
print(stockdata['date_time'][50000])
20120201 151117 770
理想情况下,我想定义我自己的函数,该函数可以由 read_csv 函数中的转换器参数调用。