2

我有三列。A 列由数字组成,B 列由 bin 范围组成,C 列由与 A 列中的单个数据相关的数字数据组成。

使用 A 列和 B 列,我创建了一个频率直方图,其中 A 列中的所有数据都已分组到 B 列的 bin 中。我想使用 C 列中的数据计算每个 bin 的平均值(即,计算使用来自 C 列的数据的每个 bin 的平均值,该数据与组成每个 bin 的每个值(来自 A 列)相关联)。

有人可以帮忙吗?

感谢您的回复。这是数据示例(不幸的是,我无法粘贴图像):

下面是三列,标题为罐子类型(体积(毫升))、饼干(罐子里巧克力饼干的数量)和箱间隔(用于计算罐子类型的箱):

  1. 容器的 Jar type-cookies-intervals
  2. 500 3 100
  3. 500 1 150
  4. 500 0.5 200
  5. 250 3 250
  6. 150 1 300
  7. 500 1 350
  8. 150 2 400
  9. 250 2 450
  10. ### # 500

制作 jar 类型频率的直方图给出了以下分组:

  1. 分频
  2. 100 0
  3. 150 2
  4. 200 0
  5. 250 2
  6. 300 0
  7. 350 0
  8. 400 0
  9. 450 0
  10. 500 4
  11. 更多 0

现在我要做的是找出可以在每种类型的罐子中找到的平均 cookie 数量。例如,对于 500 毫升,我们知道有 4x500 毫升的罐子,在每个 500 毫升中,我们总共有 3+1+0.5+1 = 5.5 个饼干。平均值为 1.735 个 cookie。

我的问题是我有 5000 多个数字,它们分成 100 个垃圾箱。

4

1 回答 1

3

该问题需要散点图的“漂移轨迹”:A 列的值(将它们绘制在水平轴上)被放入箱中,因此这些箱包括散点图中的垂直条带。C 列的值(绘制在垂直轴上)在每个条带内进行平均。这种技术可以平滑并总结散点图中的明显趋势。

电子表格

在这个包含 100 条记录的示例中,原始数据为黑色,计算值为绿色。这是手段的流浪痕迹:

阴谋

空心圆圈绘制列C(相关值)与列A(数据)的关系,而实心方块与红色虚线连接,绘制 bin 平均值(列G)与中点(列F)的关系。

任何统计包都将提供对数据进行分组和对这些组执行操作的功能。Excel 用它的SUMIFCOUNTIF函数在有限的程度上做到了这一点。要使用它们,请创建一列(D在电子表格中)显示分组因子。(这是使用“范围”选项设置为 true BINS的函数在已排序向量中进行的简单查找。)按组因子计算总和并按组因子计算。它们的比率是 bin 均值。VLOOKUPSUMIFCOUNTIF

以下是公式的样子:

公式

实际上只输入了三个公式,然后根据需要复制下来:

  • =VLOOKUP(A2, Bins, 1, TRUE)计算单元格中值的组A2Bins列中的数组 $(-2,-3, \ldots, 3)$ 的名称B

  • =AVERAGE(B3:B4)计算第一个 bin 的中点。这被用作散点图中的水平绘图位置。

  • =SUMIF(Bin,"="&B3,NewValues)/COUNTIF(Bin, "="&B3)是完成所有工作的地方。 Bin指 D 列中的组代码,并NewValues指 C 列中的关联值。棘手的部分是构造:它们形成一个文本值,指示数据通过与单元格中的数字(即第一个端点)"="&B3进行比较来进行分组。B3因为这是一个公式,所以将其复制下来会自动更新B3to B4、 thenB5等。

于 2013-09-03T15:24:54.707 回答