比如说,我有一个 100 行 x 25 列的数据表,没有列标题。我有一个包含 25 项的列表,我想将其作为列标题分配给数据表(它们的顺序已经正确)。我不知道如何使用熊猫有效地做到这一点。任何建议都会很棒!
谢谢。
您可以直接分配给columns
属性。
>>> import pandas
>>> # create three rows of [0, 1, 2]
>>> df = pandas.DataFrame([range(3), range(3), range(3)])
>>> print df
0 1 2
0 0 1 2
1 0 1 2
2 0 1 2
>>> my_columns = ["a", "b", "c"]
>>> df.columns = my_columns
>>> print df
a b c
0 0 1 2
1 0 1 2
2 0 1 2
您还可以分配给索引来完成类似的事情
>>> df.index = ["row1", "row2", "row3"]
>>> print df
a b c
row1 0 1 2
row2 0 1 2
row3 0 1 2
有一个名称参数read_csv
:
names
: 类数组
要使用的列名列表。如果文件不包含标题行,那么您
应该显式传递header=None
也就是说,您想要执行以下操作:
df = pd.read_csv(fie_name, header=None, names=col_headers_list)