14

我有一个格式如下的 CSV 文件:

somefeature,anotherfeature,f3,f4,f5,f6,f7,lastfeature
0,0,0,1,1,2,4,5

我尝试将其作为熊猫系列阅读(使用 Python 2.7 的熊猫每日快照)。我尝试了以下方法:

import pandas as pd
types = pd.Series.from_csv('csvfile.txt', index_col=False, header=0)

和:

types = pd.read_csv('csvfile.txt', index_col=False, header=0, squeeze=True)

但两者都行不通:第一个给出随机结果,第二个只是导入 DataFrame 而没有挤压。

似乎熊猫只能将格式如下的CSV识别为系列:

f1, value
f2, value2
f3, value3

但是当特征键在第一行而不是列时,pandas 不想挤压它。

还有什么我可以尝试的吗?这种行为是有意的吗?

4

6 回答 6

17

这是我找到的方法:

df = pandas.read_csv('csvfile.txt', index_col=False, header=0);
serie = df.ix[0,:]

对我来说似乎有点愚蠢,因为 Squeeze 应该已经这样做了。这是一个错误还是我错过了什么?

/编辑:最好的方法:

df = pandas.read_csv('csvfile.txt', index_col=False, header=0);
serie = df.transpose()[0] # here we convert the DataFrame into a Serie

这是将面向行的 CSV 行转换为 pandas 系列的最稳定方法。

顺便说一句,squeeze=True 参数现在没用,因为截至今天(2013 年 4 月)它只适用于面向行的 CSV 文件,请参阅官方文档:

http://pandas.pydata.org/pandas-docs/dev/io.html#returning-series

于 2013-04-02T10:08:17.850 回答
7

这行得通。挤压仍然有效,但它不会单独工作。index_col需要设置为零,如下所示

series = pd.read_csv('csvfile.csv', header = None, index_col = 0, squeeze = True)
于 2020-10-26T02:21:38.200 回答
3
In [28]: df = pd.read_csv('csvfile.csv')

In [29]: df.ix[0]
Out[29]: 
somefeature       0
anotherfeature    0
f3                0
f4                1
f5                1
f6                2
f7                4
lastfeature       5
Name: 0, dtype: int64
于 2013-04-02T14:47:33.297 回答
1
ds = pandas.read_csv('csvfile.csv', index_col=False, header=0);    
X = ds.iloc[:, :10] #ix deprecated
于 2018-11-26T15:58:08.237 回答
1

由于 Pandas 值选择逻辑是:

DataFrame -> Series=DataFrame[Column] -> Values=Series[Index]

所以我建议:

df=pandas.read_csv("csvfile.csv")
s=df[df.columns[0]]
于 2021-02-17T10:37:23.040 回答
1
from pandas import read_csv


series = read_csv('csvfile.csv', header=0, parse_dates=[0], index_col=0, squeeze=True
于 2021-12-16T12:51:46.383 回答