3

我说的是电影/物品推荐之类的东西,但房地产似乎更棘手。在访问网站并搜索 RE 时,应该向用户提供一些建议。让我们将任务分为两个任务:

a) 用户还没有输入任何个人信息 - 基于项目的推荐 b) 用户已经输入了他/她的详细信息,例如收入、位置等 - 基于项目/用户的推荐

对于任务 a),我想到的第一件事是开始对 RE 特征进行建模,但使用一些范围而不是精确值。例如:

  1. 面积m2

    • 40 - 50 我们可以将其标记为“1”
    • 50 - 70 是“2”
    • ETC ...
  2. 价格:

    • 20 - 30 千欧元将被标记为 1
    • 30 - 40 将是 2
    • ETC ...
  3. 靠近市中心:

    • 1 代表 RE 位于市中心
    • 2 区 2 或距中心 2/3 公里
    • 3 代表 3 区或距中心 7 公里

因此,拥有范围可以让我们为每个 RE 属性分配一个向量,这将允许我们使用:欧几里德距离、皮尔逊相关和一些最近邻算法。

请评论我的方法或建议一种新方法。

4

1 回答 1

4

如果您已经拥有一个流量足够大的网站,您可以尝试纯粹的协同过滤方法,即查看此属性的人也查看了这些其他属性。您可以在那里使用 Pearson 相关性以获得良好的结果。

2个RE之间的相似度可以定义为

      同时查看 RE1 和 RE2 的人数
sim = ---------------------------------
      浏览过 1 或两者的人数

当用户查看属性 RE 时,您可以根据显示属性的相似性分数对所有其他 RE 属性进行排序,并显示前几个。

您可以在此基础上添加一些明显的过滤器,例如房产的位置、价格范围等。

您还可以按照您的建议定义相似性,并将两者的结果混合在一起,以便从新的 RE 条目中获得良好的表示,如果使用纯协同过滤算法,这些条目不太可能进入。

于 2011-05-14T06:11:52.773 回答