3

使用 Pandas 读取文件时,我在解析文件的日期时遇到了一些问题。

我正在使用 python(x,y),版本 2.7。

我正在尝试读取的文件具有以下格式:

"
SomethingSomethig,
SomethingSomethig,
SomethingSomethig,
Est,dir,Vmed,raj,Vmin,desv.padrão,date,
555,162,5.30,10.10,6.50,0.67,200901010000,
555,135,6.10,10.90,6.40,0.67,200901010010,
555,156,5.90,11.00,5.90,0.76,200901010020,
555,178,6.90,10.90,5.30,0.96,200901010030,
555,200,9.80,11.20,6.10,0.96,200901010040,
555,100,9.70,11.40,5.70,0.96,200901010050,"

使用以下代码行:

dados = read_csv(file, sep=",", skiprows=3, index_col=6,parse_dates=True)

输出是:

""
Int64Index: 157968 entries, 200901010000 to 201112312350
Data columns:
Est            157968  non-null values
dir            157968  non-null values
Vmed           157968  non-null values
raj            157968  non-null values
Vmin           157968  non-null values
desv.padr?o    157968  non-null values
Unnamed: 7     157968  non-null values
dtypes: float64(4), int64(2), object(1)
""

日期未解析。尝试使用日期执行任何类型的计算时出现错误。我不知道如何使用转换器,并且真的可以使用您的帮助。

4

1 回答 1

5

对我来说很好:

In [3]: read_csv('/home/wesm/tmp/foo.txt', skiprows=3, index_col=6, parse_dates=True)
Out[3]: 
                     Est  dir  Vmed   raj  Vmin  desv.padrão  Unnamed: 7
date                                                                     
2009-01-01 00:00:00  555  162   5.3  10.1   6.5          0.67         NaN
2009-01-01 00:10:00  555  135   6.1  10.9   6.4          0.67         NaN
2009-01-01 00:20:00  555  156   5.9  11.0   5.9          0.76         NaN
2009-01-01 00:30:00  555  178   6.9  10.9   5.3          0.96         NaN
2009-01-01 00:40:00  555  200   9.8  11.2   6.1          0.96         NaN
2009-01-01 00:50:00  555  100   9.7  11.4   5.7          0.96         NaN

你用的是什么版本的熊猫?也许有一个问题只出现在整个文件中?

于 2012-03-29T02:57:43.110 回答