我正在编写一个解析 Excel 文件的 Python 脚本。此脚本的目的是计算第 1 列中的每个单元格值,即第 2 列中的值的数量。
例如,一个看起来像这样的 Excel 文件:
12 abc
12 abc
12 efg
12 efg
13 hij
13 hij
13 klm
我的脚本将返回:
For cell value 12 : 2 values "abc", 2 values "efg" and for cell value 13 : 2 values "hij" and 1 value "klm".
我尝试在 Python 中使用哈希,这就是我想要做的:
import xlrd
workbook = xlrd.open_workbook('myexcelfile.xls')
worksheet = workbook.sheet_by_name('myexcelsheet')
num_rows = worksheet.nrows - 1
num_cells = worksheet.ncols - 1
first_col = 0
scnd_col = 1
curr_row = 1
hash = []
while curr_row < num_rows:
curr_row += 1
curr_cell = -1
print 'IN ROW', curr_row
while curr_cell < num_cells:
curr_cell += 1
print 'IN CELL', curr_cell
cell0_val = int(worksheet.cell_value(curr_row,first_col))
cell1_val = worksheet.cell_value(curr_row,scnd_col)
print 'CELL VALUE', cell0_val, cell1_val
hash[cell0_val][cell1_val]+=1
我当然以错误的方式使用该哈希,但我真的是 Python 新手,我在网上找不到任何符合我真正想要的好的例子。任何帮助将不胜感激。谢谢