问题标签 [recommender-systems]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 位置坐标表示
在计算项目之间的相似度时,表示经度和纬度的最佳方法是什么?
基本上,我正在尝试在多个项目之间进行余弦相似度。除了典型的特征和元数据,我想以某种方式包括经度和纬度。这样,在推荐项目时,应考虑位置。
请有任何想法。
python-2.7 - 为什么在 Turi Create 中没有完成“Recommender 的evaluate() 方法”?
我正在尝试测试 Turi Create Project。
我的 jupyter notebook 浏览器屏幕和 Python 代码如下。
为什么在 Turi Create 中没有完成“Recommender 的evaluate() 方法”?
据我所知,“In[*]”表示该行正在 jupyter notebook 中运行。
第6行的结果如下。
感谢您的阅读。
python - 使用索引运算符时 Python 字典读取错误
最初,我尝试将我的数据集读入字典
字典包含类似这样的数据:
我正在使用该功能根据用户口味推荐歌曲
在提供输入时,我收到一个错误
错误:推荐(数据[0][user_id],4,euclidean_similarity)
tensorflow - 推荐系统的TensorFlow矩阵分解模型实现中损失函数的奇怪行为
目前推荐系统的实现使用 TF 1.8 和WALS算法。该模型使用 self.fit(input_fn=input_fn) 和运行时版本 1.8 的 ML Engine 进行训练。数据集是使用 tensorflow.train.Example(...) 从下面显示的训练日志中提取的示例形成的。
使用一些默认参数执行拟合。损失值在第二次评估时确实下降了。然而,此后的损失并没有改变。本次训练最终的 Root 加权平方误差 (rwse) 变为 0.126。
稍后进行超参数调整,并在后续训练中使用最佳参数集。该训练的结果如下所示。
树的事情要注意这里。首先,开始的损失值低于后面的评估步骤。一开始的低值很可能是由于从超参数调整的结果中选择了参数。后来损失值的增加看起来很奇怪。第二,第二次评估后损失值不变。当 self.fit(input_fn=input_fn) 用于模型训练时,此模式保持不变。第三,在使用相同参数集 rwse=0.015 进行超参数调优期间,本次训练的最终 rwse 变为 0.487。
问题是是否有人观察到类似的事情?是否可以使用 WALSMatrixFactorization 类和 self.fit(input_fn=input_fn, steps=train_steps) 来提高算法的性能?在此先感谢您的帮助。
cygwin - libFM:无法加载/保存模型
我在 cygwin 上构建了 libFM .exe,但 save_model/load_model 似乎不起作用:
文件 mod 就位并包含一些数字(大部分是零)。现在我尝试再次启动它,希望它会恢复,但它从头开始:
我从 github 尝试了两个存储库,它们都没有按我的预期工作。我错过了什么?
excel - 如何在 Microsoft Excel 中为协同过滤创建 item-item 和 user-user 矩阵?
我想了解协同过滤的项目-项目和用户-用户矩阵,以及它与基于内容的过滤有何不同。
项目用户:
从 Movies-User 矩阵开始,如何使用 Visual Basic for Applications 在 Microsoft Excel 中创建简单的 item-item 和 user-user 矩阵?
项目-项目:
用户-用户:
目前我正在使用 Microsoft Excel 函数 CORREL 计算 User1 和 UserN 之间的相关系数。我有以下 Visual Basic for Applications 代码来计算余弦相似度。在这里很好地解释了http://blog.christianperone.com/2013/09/machine-learning-cosine-similarity-for-vector-space-models-part-iii/
用法:
在这个线程中,给出了一个项目-项目矩阵的简单示例。 协同过滤:非个性化项目间相似性
machine-learning - 基于相似度的向量系数
我一直在寻找一种解决方案来创建基于向量相似性的推荐系统。基本上,我每个用户有几个向量,例如:
对于每个向量,我需要计算一个系数,并根据该系数将一个向量与另一个向量区分开来。我找到了可以根据 2 个向量的相似性计算系数的公式,我真的不想要那个。我需要一个公式来计算每个向量的系数,然后我用这些系数进行一些其他计算。有什么好的吗这个公式?谢谢
python - Python SciKit中基于用户和项目的基本数据过滤
我正在尝试根据用户的评分为用户实施推荐系统。我认为是最常见的一种。我读了很多书,并入围了 Surprise,这是一个基于 python-scikit 的推荐系统。
虽然能够导入数据并运行预测,但它并不完全符合我的要求。
现在我所拥有的:我可以传递 user_id、item_id 和评级,并获得该用户给出我通过的评级的概率。
我真正想做的事情:传递一个 user_id,然后根据数据获取该用户可能会高度喜欢/评价的项目列表。
数据文件中的示例行。
第一列是 user_id,第二列是项目 id,第三列是评分,然后是时间戳。
mahout-recommender - 是否有可能具有复合项目相似性对象的基于内容的推荐器?
我想使用 Mahout 作为推荐系统。
在我的项目中,有内容、标签、反应。用户在标记后分享内容,其他用户可以阅读内容并做出反应。
我想在任何用户阅读内容时推荐内容。
在这种情况下,如果我只使用读者信息,我将没有偏好值,这就是为什么我想使用具有默认 mahout 项目相似性的内容反应和内容标签。
我不能确定在推荐系统中使用反应和标签信息是正确的方法。是不是推荐人的问题。
如果这是我上面解释的正确方法,我正在考虑使用复合对象作为 ItemSimilarity,它包装了 Mahout 相似性实现(例如 TanimotoCoefficientSimilarity),然后将相似性计算结果与标签和反应相似性结果相加。
模型 :
(任何内容都会有大约 5 个反应选项和大约 5 个标签。)
物品相似度等级: