问题标签 [mahout-recommender]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
42 浏览

mahout - Mahout PreferenceArray 用户 ID 唯一性?

在 FastByIDMap 中的所有条目中,preferenceArray 的 userId 是否需要是唯一的?

我正在比较两种包含相似特征的对象,但是它们的 id(主键)可能不是唯一的,因为它是两个 db 表。

谢谢。

0 投票
2 回答
777 浏览

java - 隐式反馈情况下的 Mahout 推荐

我正在使用 Mahout 框架,以便使用著名的 movielens 数据集 (ml-100k) 在隐式反馈上下文中获得推荐,我已经将其二值化,考虑到 1 所有评级等于四或五,其他所有评级为零。在这个数据集中有五个拆分,每个拆分都像往常一样分为测试集和训练集。

在推荐过程中,我使用简单的 GenericBooleanPrefUserBasedRecommender 和 TanimotoCoefficientSimilarity 训练推荐器,如以下代码行所述:

当我执行此代码时,结果是一个 0.0 或 1.0 的列表,它们在隐式反馈上下文中的 top-n 推荐上下文中没有用。仅仅是因为我必须为每个项目获得一个保持在 [0, 1] 范围内的估计率,以便按降序对列表进行排名并适当地构建 top-n 推荐。

那么这段代码有什么问题呢?我错过了什么或有什么不正确的吗?或者也许是 Mahout 框架没有提供使用二进制反馈的正确方法?

先感谢您,

亚历山德罗·苏利亚

0 投票
1 回答
1399 浏览

mahout - 如何在 Mahout 0.9 中实现 SlopeOne 推荐器?

我是 Mahout 的新手,正在尝试使用 0.5 版本的“Mahout in Action”。早期的示例之一要求使用斜率一推荐器。Mahout 0.9 中是否仍包含此推荐器?我浏览了文档,但找不到。也许它已经改变了名字?

谢谢你的帮助!

0 投票
1 回答
210 浏览

eclipse - 如何使用 play 框架配置 mahout

如何在 play-framework 2.2 中包含 mahout 0.9 库。我在 eclipse 的构建路径中添加了 jar 文件,但是当我运行 play 应用程序时,mahout 导入显示以下错误

0 投票
2 回答
1978 浏览

machine-learning - Mahout推荐项中相似性策略的区别

我正在使用基于 mahout 推荐项的算法。所有可用的 --similarity 类之间有什么区别?如何知道我的应用程序的最佳选择是什么?这些是我的选择:

每一个是什么意思?

0 投票
2 回答
262 浏览

hadoop - hadoop、mahout和CDH之间的版本匹配

我需要使用最新的 mahout 版本 0.9(因为我需要使用所有分布式推荐算法)。为此,我应该使用哪个版本的 hadoop?

在某些地方,有人提到 hadoop 2.20 不适用于 mahout 0.9。因此,我可以使用 mahout 0.9 的最低 hadoop 版本是什么。

如果我使用的是 cloudera(CDH),我应该使用什么版本来处理 mahout 0.9。

0 投票
1 回答
1171 浏览

hadoop - 如何使用基于 KNN 的 Item Recommender 从命令行运行 mahout?

我是 mahout 的新手,仍在努力解决问题。

我正在尝试使用在 hadoop 集群(分布式推荐器)中运行的 mahout 0.8 运行基于 KNN 的推荐器。我正在使用 mahout 0.8,因此不推荐使用 KNN,但它仍然可用(至少当我在 java 代码中制作它时)

我有几个问题:

  1. 基本上有两个 mahout 实现是真的吗?分布式(从命令行运行) 非分布式(从 jar 文件运行)

  2. 假设 (1) 是正确的,mahout 是否支持从命令行运行基于 KNN 的推荐器?有人可以给我一个方向吗?

  3. 假设(1)是错误的,如何在 java(我正在使用 eclipse)中构建一个在 hadoop 集群(分布式)中运行的推荐器?

谢谢!

0 投票
1 回答
581 浏览

hadoop - Hbase 0.96 与 Mahout 0.9 的集成

是否可以使用 H base 0.96 版作为 Mahout 0.9 版的数据源?

示例:- 在 Hbase 表上运行 Mahout。

我正在使用具有以下配置的系统:- Ubuntu 14.04 -64 位架构。提前致谢。

0 投票
1 回答
167 浏览

mahout - 尽管 Pearson Corellation 相似性最好,但没有对小型数据集提出建议

在 Mahout 中运行 Recommender 引擎时遇到一个小问题:

我正在处理的数据集如下:

当我计算 1 和 3 之间的 Pearson 相似度时,我得到一个值 0.99999998 大约 1.0 这是最好的相似度,所以根据推荐规则。推荐给 User_ID 3 的输出应该是 Item_ID 107

但我的输出没有给出任何建议。

下面是我的代码:

}

如果有人能指出错误,或者我对 Mahout pearson corellation 的理解是错误的,我将不胜感激。

0 投票
2 回答
447 浏览

mahout - Mahout 的基于推荐项返回已存在的项

我使用了 mahout (v 0.9) 的推荐项和参数

--input /usr_pref.csv --numRecommendations 10 --output /out/ --tempDir /temp1/ --similarityClassname SIMILARITY_PEARSON_CORRELATION

在检查结果时,我发现它向用户推荐了他已经评价过的项目。为什么会发生这样的事情?

感谢您的时间。

根据要求,这里是建议的片段:

34175 [89005462:1.7624004,89017464:0.11477072,89011967:0.11375865,89007606:0.113421306,14103126:0.11096669,89002502:0.10888276,14103124:0.106607914,89011035:0.10636083,40111014:0.104254685,89016109:0.104254685]

以及用户偏好中的相应行:

34175,89005462,0.07596562

我已经在 Dropbox 中上传了这两个文件。建议:https ://www.dropbox.com/s/uapzq0926y7427p/outusrpref_final 用户偏好:https ://www.dropbox.com/s/6nru9799udgrzl8/usr_pref_final.csv

更新考虑到我的问题与我的评级范围有关,我将它们乘以 100,然后将它们截断为两位小数。运行推荐器后,我发现没有重复项。我仍然不明白为什么会这样。