我遇到了这个数据集:
http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data
而且我找不到将其放入 Pandas Dataframe 的简单方法。我手动将其解析为列表列表,然后调用 Dataframe 构造函数,但是否有更简单的方法来执行此操作。谢谢!
我遇到了这个数据集:
http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data
而且我找不到将其放入 Pandas Dataframe 的简单方法。我手动将其解析为列表列表,然后调用 Dataframe 构造函数,但是否有更简单的方法来执行此操作。谢谢!
尝试使用pandas.read_fwf
并指定列宽列表(包括空格):
In [35]: url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data'
In [36]: widths = [7, 4, 10, 10, 11, 7, 4, 4, 30]
In [37]: df = pd.read_fwf(url, widths=widths, header=None, na_values=['?'])
In [38]: df.irow(0)
Out[38]:
X0 18
X1 8
X2 307
X3 130
X4 3504
X5 12
X6 70
X7 1
X8 "chevrolet chevelle malibu"
Name: 0