1

我在excel中有2列和多行数据。每列代表一个算法,行中的值是这些算法具有不同参数的结果。我想用excel对这两种算法进行统计显着性检验。任何人都可以建议一个功能吗?

因此,最好声明“算法 A 的性能比算法 B 好 8%,概率为 0.9(或 95% 置信区间)”

维基百科文章准确地解释了我需要什么: http ://en.wikipedia.org/wiki/Statistical_significance

这似乎是一项非常容易的任务,但我没有找到科学的测量功能。

任何关于 excel 或函数片段的内置函数的建议都值得赞赏。

谢谢..

编辑:

在 tharkun 的评论之后,我意识到我应该澄清一些观点:结果只是 1-100 之间的实数(它们是百分比值)。由于每一行代表一个不同的参数,因此一行中的值代表该参数的算法结果。结果不相互依赖。当我取算法 A 和算法 B 的所有值的平均值时,我发现算法 A 产生的所有结果的平均值比算法 B 高 10%。但我不知道这是否具有统计学意义。换句话说,也许对于一个参数,算法 A 的得分比算法 B 高 100%,而对于其余的,算法 B 的得分更高,但仅仅因为这一结果,平均差异为 10%。我想只用excel来做这个计算。

4

1 回答 1

3

感谢您的澄清。在这种情况下,您想要进行独立样本 T 检验。这意味着您要比较两个独立数据集的均值。

Excel 有一个函数 TTEST,这就是你所需要的。

对于您的示例,您可能应该使用两条尾巴并输入 2。

该公式将输出一个称为 alpha 错误概率的概率值。如果您假设两个数据集不同但它们不是,这就是您会犯的错误。阿尔法错误概率越低,您的集合不同的机会就越高。

如果值低于 0.01 (1%) 或对于关键结果甚至 0.001 或更低,您应该只接受两个数据集的差异。您还应该知道,在 t 检验中,每个数据集至少需要大约 30 个值才能足够可靠,并且类型 2 检验假设两个数据集的方差相等。如果没有给出相等的方差,您应该使用类型 3 测试。

http://depts.alverno.edu/nsmt/stats.htm

于 2009-08-05T12:05:49.327 回答