问题标签 [recommender-systems]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
3481 浏览

python - 如何构建使用多个属性的基于内容的推荐系统?

我想在 Python 中构建一个基于内容的推荐系统,它使用多个属性来确定两个项目是否相似。在我的例子中,“项目”是由 C# 包管理器(示例)托管的包,它们具有各种属性,例如名称、描述、标签,可以帮助识别类似的包。

这里有一个原型推荐系统,目前只使用一个属性,描述,来决定包是否相似。它计算描述的 TF-IDF 排名,并基于此打印出前 10 条推荐:

如何cosine_similarities与其他相似性度量(基于同一作者、相似姓名、共享标签等)相结合,为我的推荐提供更多背景信息?

0 投票
2 回答
53 浏览

python - 神经网络推荐无法让它运行

我知道这将是一个非常愚蠢的问题,因为我应该对它进行更多研究(我做过)但是我在 5 个多小时后被卡住了,我认为如果我继续这样做会浪费时间继续前进的提示/线索。

我试图运行这个项目(https://github.com/mesuvash/NNRec)来实际查看使用给定训练数据的结果如何,但我似乎无法让它运行我已经完成了安装并且我的大部分依赖项都在那里,但是我无法执行“PYTHONPATH= python learner.py -c”步骤,在排除故障后我认为它读取了 NNrec 中的 utils 文件夹,但没有读取 nn 文件夹中的块我真的不知道如何解决这个问题

我正在使用带有cmder的Windows 10,并且我的笔记本电脑中安装了2.7和3.6 python

0 投票
1 回答
394 浏览

machine-learning - 如何根据购买的物品找到相似的用户

我有用户和用户购买的产品,用户给出的产品似乎没有评分。Blow 是样本数据

数据 :

我们可以根据以上数据找到类似的客户吗?我正在尝试使用 1 来购买产品,如果不像下面那样使用 0。

使用上面的矩阵,我如何找到相似的客户。期待以下格式的输出。

0 投票
2 回答
101 浏览

machine-learning - 尽管存在缺失值,但过度拟合,基于树的学习

我和我的同学们,我们正在做一个教育机器学习项目,我们遇到了一个过度拟合的问题,因为我们对数据挖掘非常缺乏经验。

我们的商业案例是关于零售银行业务,我们的目标是根据产品搜索客户目标群体。向客户推荐基于已经购买的产品的特定产品,如股票、基金、存款等。

我们收到了一个包含大约 400 个特征和 150.000 条数据记录的数据集。我们在 Knime 中构建我们的工作流程。我们的工作流程包括以下步骤:

  • 我们探索了数据并定义了目标变量
  • 我们使用缺失值列过滤器来消除所有缺失值最多的列
  • 我们还应用了 Tree Ensemble Workflow 来减少维度

总而言之,我们清理了我们的数据并将其从 400 个变量减少到大约 50 个。对于建模,我们使用一个简单的决策树 - 这里出现了问题:这棵树总是给出 100% 的准确度 - 所以我们假设它是高度过拟合。

我们做错了什么吗?或者我们应该关注什么?

我们希望社区可以为我们提供一些提示或提示。

编辑: 是否有任何资料、论文等如何在数据挖掘工具(例如 knime)中应用交叉销售?我们已经用谷歌搜索了它,但到目前为止我们还没有成功。

0 投票
1 回答
594 浏览

recommendation-engine - 推荐系统中的数据收集

什么是收集用户数据的正确方法,以使其可用于模型构建(离线)和推荐系统中的预测(在线)?假如说:

  1. 预测是通过多个服务器完成的。服务器有一些可用内存,但从用户数据的角度来看,它们被认为是无状态的。这意味着用户可以在会话期间与不同的机器进行交互,并且无论用户登陆哪台机器,用户数据都应该可用。
  2. 所有附加到文章和推荐项目(如分类、文章文本等)的元数据都可以在线和离线使用。但是,获取此数据需要 db 调用。
  3. 一些用户活动需要相当快地用于推理,而其他活动可能在它发生几小时后可用。例如,在用户点击推荐后,我们希望尽快提供此信息。另一方面,在用户浏览该内容后,可以在推理小时内获得长期浏览行为数据。
  4. 所有用户的数据都太大而无法在训练时保存在内存中。

问题:该系统应该大规模运行。人们会使用哪些主要技术和主要数据结构?

0 投票
1 回答
41 浏览

r - 为推荐系统构建序列数据——用变量值替换交叉表矩阵

我正在尝试为推荐系统构建序列数据。我已经建立了一个交叉表数据(表1)和表2,如下所示:

在此处输入图像描述

我一直在尝试用 R 中表 2 中的“等级”替换表 1 中的所有 1。

非常感谢任何见解/建议。

0 投票
1 回答
175 浏览

json - Ubuntu 16.04 中的 Redis Json 解析错误

我想从https://github.com/groveco/content-engine实现推荐系统 (查看该 github 中的 web.py,我已按照自述步骤进行操作)

但是 Redis 服务器有一些问题并抛出 JSON 解析错误。我在下面添加了截图

Redis 服务器搭建完成

JSON解析错误

0 投票
1 回答
9595 浏览

python - DatasetAutoFolds 对象在 python 上没有属性“global_mean”

我正在使用惊喜来执行交叉验证

我这样调用函数

我得到这个错误

我错过了什么??

0 投票
1 回答
371 浏览

postgresql - PredictionIO UniversalRecommender 弹性搜索错误

我正在使用 Prediction.io 附带的 Universal Recommender,运行./examples/integration-test脚本时出现以下错误(在此处找到)。

我的配置(PredictionIO/conf/pio-env.sh)看起来像:

我正在尝试将 PSQL 用于所有三种类型的存储(元、事件和模型),所以不知道为什么我会收到错误 RE elasticsearch?

我需要在某处运行弹性搜索吗?

  1. 项目清单
0 投票
1 回答
447 浏览

python-2.7 - 显示,AttributeError:“模块”对象没有属性“SFrame”

我正在尝试使用推荐系统,我已经安装了 graphlab 并获得了产品密钥等。加载数据集后,它显示了数据集的所有信息,但是当我尝试使用 graphlab 时,它显示错误AttributeError: 'module' object has no attribute 'SFrame'。我也尝试重新启动内核并更新 Conda。