0

假设我的文件包含这些数据:

t   c   a
a   1   2
b   2   3
c   1   1

为了只选择和保存我感兴趣的列,我按照这篇文章安装了 pandas 模块。然后我做了:

>>> df = pandas.read_csv('test')
>>> df
    t\tc\ta
 0  a\t1\t2
 1  b\t2\t3
 2  c\t1\t1

但是,当我键入df.a以选择列“a”时,我收到此错误:

AttributeError: 'DataFrame' object has no attribute 'a'

也尝试df['t']并得到了这个错误:

KeyError: u'no item named t'
4

1 回答 1

3

指定分隔符(默认为,)。

>>> import pandas
>>> with open('test.csv', 'w') as f:
...     f.write('t\tc\ta\na\t1\t2\nb\t2\t3\nc\t1\t1\n')
... 

>>> df = pandas.read_csv('test.csv')
>>> df.columns
Index([t    c   a], dtype=object)

>>> df = pandas.read_csv('test.csv', delimiter='\t') # <--
>>> df.columns
Index([t, c, a], dtype=object)

>>> df['t']
0    a
1    b
2    c
Name: t
于 2013-08-11T14:01:13.843 回答