2

我有一个购物网站。我想建立一个简单的预测模型来预测用户在单次访问时购买某种产品的可能性(在每个页面上花费的时间,她来自哪里,她红了多少评论等),当他可能留下一页等

在 Ruby on Rails、Python 或 Java 中有哪些可用的工具来完成这项任务?典型的统计建模技术(例如逻辑回归、线性回归)是否适用于这种情况?

谢谢你。

4

1 回答 1

4

我会尝试将问题简化为分类问题 - 并使用机器学习现有工具来获得答案。

以下是您需要采取的一些步骤:

  1. 使用您的数据并从中提取定义的特征。例如,一个特征可以是:访问的页面数或在网站上花费的时间,或者您可以从数据中提取的任何其他内容。
  2. 定义您想要“预测”(分类)的特征是什么。一个简单的例子可能是:购买产品(让我们从购买任何产品开始,您可以稍后尝试增强它)。
  3. 创建一个训练集。训练集包含尽可能多的分类示例。(例如:用户我访问了 5 个不同的页面并花了 4 分钟,已知分类:没有购买产品)。
  4. 鉴于此信息,您可以运行任何现有的分类算法,以尝试预测非分类用户所做的事情,仅考虑她的特征。

您可以为此使用的一些算法的简短列表:

  1. SVM - 不直观 - 但被许多可用的最佳分类算法认为。
  2. K 最近邻- 非常直观且易于编程,而且训练集可以很容易地迭代增加,但如果特征数量很多,通常是一个糟糕的决定。
  3. 决策树算法,尤其是C4.5:允许非常快速的分类,并且生成的树对人类来说是直观且可读的。

我不知道 Ruby on rails 或 python 工具,但在 Java 中 - 有一个名为Weka的开源项目,它具有这些分类算法等等。

笔记:

您可以通过在训练集上使用交叉验证来评估您的算法并获得您的混淆矩阵(评估算法的正确程度和错误程度以及如何) 。

于 2012-05-11T12:41:37.267 回答