我正在阅读“用于数据分析的 Python”一书,在“示例:2012 年联邦选举委员会数据库”部分将数据读取到 DataFrame 时遇到了麻烦。问题是其中一列数据总是被设置为索引列,即使 index_col 参数设置为 None。
这是数据的链接:http ://www.fec.gov/disclosurep/PDownload.do 。
这是加载代码(为了节省检查时间,我设置了 nrows=10):
import pandas as pd
fec = pd.read_csv('P00000001-ALL.csv',nrows=10,index_col=None)
为了简短起见,我排除了数据列输出,但这是我的输出(请不要索引值):
In [20]: fec
Out[20]:
<class 'pandas.core.frame.DataFrame'>
Index: 10 entries, C00410118 to C00410118
Data columns:
...
dtypes: float64(4), int64(3), object(11)
这是本书的输出(同样不包括数据列):
In [13]: fec = read_csv('P00000001-ALL.csv')
In [14]: fec
Out[14]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1001731 entries, 0 to 1001730
...
dtypes: float64(1), int64(1), object(14)
我输出中的索引值实际上是文件中的第一列数据,然后将所有其余数据向左移动一个。有谁知道如何防止这列数据被列为索引?我希望索引只是 +1 增加整数。
我对 python 和 pandas 还很陌生,所以对于给您带来的不便,我深表歉意。谢谢。