0

I have a rather simple task to achieve but I am not sure how to do that in excel.

I have a list of values and number of counts of each value (my variable is discrete). I am trying to calculate 1st and 3rd quartiles of the variable given the counts I have. Overall dataset will be too large to fit into excel in raw format so I am using matrix of value counts.

Example:

Value | Count
1 | 100000
2 | 300000
3 | 350000
4 | 100000
5 | 50000
6 | 1000
7 | 10

I need to generate 1st, 3rd quartile and median out of this dataset, but as far as I see excel's quartile accepts only raw values, not values and their counts.

4

2 回答 2

2

假设您提供的表格位于A1:B8(第 1 行有标题),对于中位数,您可以使用以下数组公式**

=SUM(LOOKUP(INT(SUM(B2:B8)/2+{0.5,1}),MMULT(N(ROW(B2:B8)>=TRANSPOSE(ROW(B2:B8))),N(+B1:B7))+1,A2:A8))/2

请注意这里的一个偏移范围 ( ) ,如前所述,B1:B7这里假设包含一个(文本)标题。B1

编辑:重新四分位数,这取决于您是希望根据 Excel QUARTILE 函数还是根据其“标准”定义来计算这些,即作为数据上/下半部分的中位数(参见此处)。

问候

**数组公式的输入方式与“标准”公式不同。不是只按 ENTER,而是先按住 CTRL 和 SHIFT,然后再按 ENTER。如果操作正确,您会注意到 Excel 在公式周围放置了大括号 {}(尽管不要尝试自己手动插入这些括号)。

于 2018-11-12T08:46:39.527 回答
1

我认为这仅使用公式是不可能的。您可以轻松地创建具有单独列表的公式,以避免总行数多于 excel 行的问题,但我不知道有什么方法可以将这些列表附加到函数内部的一个大列表中。也许其他人知道一种方法,但与此同时 Excel 中还有另一种方法:

您可以使用的是电源查询和电源枢轴。您从您拥有的表开始并将其添加到查询(数据 - “获取和转换数据”部分 - “从表/范围”。我有 Excel 2016 所以如果你有不同的版本,路径很可能是不同的或在旧版本中,这些工具不可用)

现在编辑查询并使用List.Repeat添加另一列以创建完整的数据集,展开值并加载到数据模型(当您在查询编辑器中时,转到“主页”-“关闭并加载”,单击向下的小箭头并选择“关闭并加载到...”并选择“仅创建连接”并选中“将此数据添加到数据模型”)

在“Power Pivot”选项卡中,您可以添加一个新的 Measure 来计算该表的四分位数。我用了

quartile:=PERCENTILE.EXC(AllData[AllValues];0,25)

因为我不认为真的有特殊的四分位数功能。

于 2018-11-12T08:18:48.853 回答