python - 如何计算几个目标转化率的统计显着性？

Question

我正在制作一个 python/django 拆分测试或 a/b 测试库供我自己使用。但是我不知道如何计算我的测试是否具有统计意义。我没有统计学知识，所以我无法理解大多数维基百科文章或有关该主题的网页，因此我正在寻求其他程序员的帮助。

我有一个包含 4 个选项的简单实验，并且我有一些用户使用它的数据。每个用户都在 4 个选项之一中（为了论证，我们可以在控件上调用第一个）。每个用户要么成功要么失败，所以我知道每个选项的转化率。我如何确定我的测试是否具有统计意义，或者它是否只是随机的。

基本上我的输入[ (a_yes, a_total), (b_yes, b_total), (c_yes, c_total), (d_yes, d_total)]是任何东西，或者我是否应该继续让它运行并收集更多数据。

当只有 2 个选项（传统的 a/b 测试）时，我已经看到了一些关于使用某些公式的指南，但我希望这个库能够处理多个选项。是否甚至可以计算具有多个值的统计显着性。

本质上，我正在尝试做一些类似于这个http://mixpanel.com/labs/split-test-calculator但在 python 中的事情。如果有一些 python 库我可以加分，我可以“pip install ...”

score 4 · Accepted Answer

我相信你需要的是独立性的卡方检验。对于每种治疗，您都有一个是计数和一个否计数 ( total - yes)。该方法在此处以及其他地方进行了描述。

1 回答 1