17

有没有更简单的方法可以将 excel 文件直接加载到 Numpy 数组中?

我查看了numpy.genfromtxtnumpy 文档中的自动加载功能,但它不直接加载 excel 文件。

array = np.genfromtxt("Stats.xlsx")
ValueError: Some errors were detected !
Line #3 (got 2 columns instead of 1)
Line #5 (got 5 columns instead of 1)
......

现在我正在使用 usingopenpyxl.reader.excel读取 excel 文件,然后附加到 numpy 2D 数组。这似乎效率低下。理想情况下,我希望将 excel 文件直接加载到 numpy 2D 数组中。

4

1 回答 1

17

老实说,如果您正在处理异构数据(电子表格可能包含),则使用 apandas.DataFramenumpy直接使用更好。

虽然pandas在某种意义上只是 numpy 的一个包装器,但它非常非常好地处理异构数据。(还有很多其他的东西......对于“电子表格式”数据,它是 python 世界的黄金标准。)

如果您决定走那条路,只需使用pandas.read_excel.

于 2013-06-11T20:38:43.143 回答