2

Myrrix 有以下输入:

11, 101, 1
11, 102, 1
11, 103, 1
11, 104, 1000
11, 105, 1000
11, 106, 1000

12, 101, 1
12, 102, 1
12, 103, 1
12, 222, 1

13, 104, 1000
13, 105, 1000
13, 106, 1000
13, 333, 1000

我正在寻找要推荐给用户 11 的项目。期望项目 333 将首先被推荐(因为用户 13 和项目 104、105、106 的权重较高)。

以下是 Myrrix 的推荐结果:

11, 222, 0.04709
11, 333, 0.0334058

请注意,建议项目 222 的强度为 0.047,但项目 333 的强度仅为 0.033——与预期结果相反。

我还预计强度差异会更大(因为 1000 和 1 是如此不同),但显然,当订单甚至不是我所期望的时,这是没有实际意义的。

我如何解释这些结果以及我应该如何考虑重量参数?我们正在与一个大客户在紧迫的期限内合作,并希望得到任何指点。

4

1 回答 1

1

根据小型综合数据集很难判断。我认为最大的因素将是这里的参数——特征的数量是多少?拉姆达?我希望 features = 2 这里。如果它更高,我认为您很快就会过度拟合,结果主要是在完美解释用户 11 不与 222 和 333 交互之后留下的噪音。

这些值非常低,表明这两个都不是可能的结果,因此它们的顺序可能比任何东西都更嘈杂。如果从另一个随机起点重建模型,您会看到不同的结果吗?

于 2013-09-16T07:18:11.367 回答