35

如何将excel数据导入python中的数据框。

基本上,当前的 excel 工作簿在打开时会运行一些 vba,它会刷新数据透视表并执行其他一些操作。

然后我希望将数据透视表刷新的结果导入 python 中的数据框以进行进一步分析。

import xlrd

wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

#sheetnames
print wb.sheet_names()

#number of sheets
print wb.nsheets

文件的刷新和打开工作正常。但是我如何从第 5 行的第一张表中选择数据,包括标题到最后一条记录 n。

4

2 回答 2

52

您可以使用 pandas 的 ExcelFileparse方法来读取 Excel 表格,请参阅io docs

xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA'])

skiprows将忽略前 4 行(即从行索引 4 开始)和其他几个选项

于 2013-07-09T13:02:34.043 回答
24

接受的答案是旧的(如接受答案的评论中所述)。现在首选选项是使用pd.read_excel()。例如:

df = pandas.read_excel('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm'), skiprows=[0,1,2,3,4])
于 2017-04-28T18:01:50.430 回答