0

我有一个包含 7337 名客户的列表(之所以被选中,是因为他们在 2018 年 3 月至 8 月期间只有一次预订)。我们将与他们联系,并试图测试这些活动对他们销售的影响。这个想法是,与他们联系将使他们预订更多,并增加这个基本上不活跃的群体的销售额。

我必须设置一个 A/B 测试,目前卡在样本量计算上。

这是我的示例数据: 数据

第一列是他们的 ID,第二列是该组 1 月份 2 周的总销售额(我花了 2 周,因为该组中的客户很少购买)。

我确定的指标是每位客户的收入(RPC = 总收入/总客户),因此我可以同时考虑订单数量和该组的平均订单价值。

该组的 RPC 为 $149,482.7/7337=$20.4

我希望能够在 80% 的功效和 5% 的显着性水平下检测到该指标至少增加 5%。首先,我计算了效果大小。

数据集的标准偏差 = 153.9 影响大小 = (1.05*20.4-20.4)/153.9 = 0.0066

然后我使用 R 中的 pwr 包来计算样本量。

pwr.t.test(d=0.0066, sig.level=.05, power = .80, type = 'two.sample')

 Two-sample t test power calculation 

          n = 360371.048
          d = 0.0066
  sig.level = 0.05
      power = 0.8
alternative = two.sided

然而,我得到的样本量是 360,371。这大于我的人口规模(7337)。

这是否意味着我无法以足够的功率运行测试?我可以确定在不影响显着性或功效的情况下降低样本量的唯一方法是增加效应量以确定最小增加 50%,这将使我得到 n=3582。

这听起来影响很大,我不确定这种影响是否合理。

这是否意味着我不能在这里运行 A/B 测试来衡量影响?

4

0 回答 0