现在我有一列这样的数据:
0.000000
0.000000
0.000000
0.000000
0.024995
0.024996
0.024996
0.024997
0.024997
0.024997
0.024997
0.025004
0.025010
0.025011
0.025996
0.025996
0.025996
首先我要计算这些数据的累积概率,并显示在B列,然后根据A列和B列,绘制CDF图。
谁知道我应该使用什么公式?
在第一个条目(在我的示例中为 B1)左侧的单元格中,输入以下内容:
=COUNT(A$1:A1)/COUNT($A$1:$A$17)
然后将其填入列中。
=A1:A17
要创建 CDF 图表,请使用 x-values和 y-values创建散点图(带有插值线)=B1:B17
。
注意:
由于您的数据开头有多个重复值,您可能只想绘制 x-value=A4:A17
和 y-values =B4:B17
。这实际上取决于变量的性质。如果很明显最小可能值为零,您可以这样做。
我假设您提供的数字是概率密度函数 (PDF),并且您想从该 PDF 计算累积分布函数 (CDF)。在这种情况下...
B1 将只是=A1
. B2 =B1+A2
、 B3=B2+A3
等。然后突出显示 B 列中的数据,单击“插入”选项卡,然后选择折线图。或者,您可以在 B1 中=SUM(A$1:A1)
填写并填写。
顺便说一句,CDF 通常在 0 和 1 之间单调增加。您的 PDF 不会生成一直到 1 的 CDF。因此,如果这是您的目标,您要么没有列出所有数据在您的 PDF 中,或者您需要以不同的方式缩放。您可以将 A 列中的每个元素除以这些元素的总和,总和为 1。但是,如果您想要的只是一个正确定义的 CDF,您可以直接通过设置 B1=SUM(A$1:A1)/SUM(A:A)
并再次填写来完成。