我是 Python 的新手,我在这个问题上遇到了很多麻烦,这是我必须为工作做的事情。
关于 excel 文件的一些背景知识:有 3 列,大约 100 行。第一列 (col1) 包含 A 或 B。第二列 (col2) 包含从 1 到 10 的任何数字。第三列 (col3) 包含任何十进制数的值。
我希望程序做的是解析数据。col1 和 col2 将有许多重复项放在一起。例如,(A, 1) 可以位于第 1、5、20、98 行等。但 col3 将是不同的数字。因此,对于第三列中的那些不同数字,我希望它找到所有这些数字的平均值。
输出应如下所示:
A, 1 = avg 4.32
A, 2 = avg 7.23
A, 3 = avg -9.12
etc etc (until number 10)
B, 1 = avg 3.76
B, 2 = avg -8.12
B, 3 = avg 1.56
etc etc (until number 10)
它不必按照完整的字母和数字顺序,它可以打印出它找到的第一个组合。但是到目前为止我已经在我的代码中完成了这个,并且由于某种原因它没有打印出所有组合,只有3个。
import xlrd #import package
#opening workbook and reading first sheet
book = xlrd.open_workbook('trend.xls')
sheet = book.sheet_by_index(0)
#function to hold unique combos
unique_combinations = {}
#looping through data
for row_index in range(sheet.nrows):
#declaring what group equals to what row
col1 = sheet.cell(row_index, 0)
col2 = sheet.cell(row_index, 1)
col3 = sheet.cell(row_index, 2)
unique_combo = (col1.value, col2.value)
if unique_combinations.has_key(unique_combo):
unique_combinations[unique_combo].append(col3.value)
else:
unique_combinations[unique_combo] = [col3.value]
for k in unique_combinations.keys():
l = unique_combinations[k]
average = sum(l) / len(l)
print '%s: %s Mean = %s' % (k[0], k[1], average)
本质上,它基本上是 2 组,在 2 组中还有另外 10 组,在这 10 组中是属于那里的数字的平均值。
请帮忙!非常感谢你。
EXCEL 文件示例:
col1 | col2 | col3
A | 1 | 3.12
B | 9 | 4.12
B | 2 | 2.43
A | 1 | 9.54
B | 8 | 2.43
A | 2 | 1.08
所以程序要做的就是看到它遇到的第一个组合是 A, 1 并且它将 3.12 存储在一个列表中,然后查看下一个并继续存储,直到它遇到与第四个重复的组合排。它也会存储该值。最后,输出将显示 A, 1 = avg (3.12 + 9.54 / 2)。此示例仅针对 A, 1 组合显示。但实际上,只有 2 个组(如示例),但 col2 的范围可以从 1 到 10。会有很多重复。