df
是一个日期范围内股票价格的数据框。df.shape 是 (367,1709)。行是日期的时间戳,列是股票代码。时间戳的范围从 02.04.2012 到 27.09.2013。
我运行一个for循环如下:
ldt_timestamps=df.index
symbols = df.columns
for sym in symbols:
for i in range(1, len(ldt_timestamps)) # looping from 2nd row to calculate ratio of today's price and yesterdays price
f_symprice_today = df[sym].ix[ldt_timestamps[i]]
问题是循环遇到错误'KeyError-Timestamp:2012-04-03 00:00:00。我跟踪错误并发现它发生在循环到达特定股票代码列 - “M50”时。这是第 891 栏
我尝试了以下方法:
检查是否是导致错误的时间戳,我检查了 df['M50'].ix[ldt_timestamps[200]]。错误是相同的(尽管时间戳不同)。
检查是否导致错误的股票代码。我尝试使用其他符号。没有错误。即使我尝试了在“M50”之后出现的符号,也没有错误。所以问题是符号。但符号取自数据框的列。
为了进一步理解错误,我尝试了 df['M50'].shape,它返回 (0,1709)。这很有趣,因为当我尝试使用其他股票代码时,形状总是 (367,)
df.T.Head 显示以下内容:
<class 'pandas.core.frame.DataFrame'>
Index: 5 entries, 20MICRONS to AANJANEYA
Columns: 367 entries, 2012-04-02 00:00:00 to 2013-09-27 00:00:00
dtypes: float64(367)
写入 csv 的 df 如下所示:
date 20MICRONS 3IINFOTECH 3MINDIA A2ZMES AANJANEYA AARTIDRUGS
4/2/2012 83.85 16.15 3761.25 116.75 560.7 104.4
4/3/2012 83.75 16.1 3997.65 125.95 553 103
4/4/2012 81.75 16.05 3992.3 122.55 552.25 104.55
4/9/2012 81.55 15.7 4176.45 118.05 522.2 103.65
4/10/2012 83.05 15.75 4234.1 118.85 523.8 105.5
4/11/2012 81.75 15.85 4238.6 115.95 510.9 108.2
4/12/2012 81.6 15.9 4371.75 114.5 529 109.9
4/13/2012 81.85 15.5 4403.4 112.55 514.7 112.1
4/16/2012 80.7 15.5 4449.65 112.95 509.9 111.9
真是不知所措。请求帮助以找出仅导致一个股票代码出现此错误的原因。