我试过:
x=pandas.DataFrame(...)
s = x.take([0], axis=1)
并s
获得一个 DataFrame,而不是一个系列。
>>> import pandas as pd
>>> df = pd.DataFrame({'x' : [1, 2, 3, 4], 'y' : [4, 5, 6, 7]})
>>> df
x y
0 1 4
1 2 5
2 3 6
3 4 7
>>> s = df.ix[:,0]
>>> type(s)
<class 'pandas.core.series.Series'>
>>>
==================================================== ==========================
更新
如果您在 2017 年 6 月之后阅读此内容,ix
则已在 pandas 0.20.2 中弃用,因此请不要使用它。使用loc
或iloc
代替。请参阅此问题的评论和其他答案。
从 v0.11+,... 使用df.iloc
.
In [7]: df.iloc[:,0]
Out[7]:
0 1
1 2
2 3
3 4
Name: x, dtype: int64
您可以通过以下代码将第一列作为系列获取:
x[x.columns[0]]
这不是最简单的方法吗?
按列名:
In [20]: df = pd.DataFrame({'x' : [1, 2, 3, 4], 'y' : [4, 5, 6, 7]})
In [21]: df
Out[21]:
x y
0 1 4
1 2 5
2 3 6
3 4 7
In [23]: df.x
Out[23]:
0 1
1 2
2 3
3 4
Name: x, dtype: int64
In [24]: type(df.x)
Out[24]:
pandas.core.series.Series
当您想从 csv 文件加载系列时,这非常有用
x = pd.read_csv('x.csv', index_col=False, names=['x'],header=None).iloc[:,0]
print(type(x))
print(x.head(10))
<class 'pandas.core.series.Series'>
0 110.96
1 119.40
2 135.89
3 152.32
4 192.91
5 177.20
6 181.16
7 177.30
8 200.13
9 235.41
Name: x, dtype: float64
df[df.columns[i]]
其中i
是列的位置/编号(从0开始)。
所以,i = 0
是第一列。
您还可以使用获取最后一列i = -1