问题标签 [mahout-recommender]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
760 浏览

hadoop - common.AbstractJob:处理特定于作业的选项时出现意外的 -libjars

全部!当我在我的项目中使用 RecommenderJob 时,我遇到了一个意外错误。传递给作业的参数是一个字符串数组,其值如下:

通过以下代码运行作业后:

它打印一个错误如下:

有谁知道如何解决它。提前致谢!

0 投票
1 回答
148 浏览

solr - 在没有 hadoop 和 eclipse 的情况下安装 mahout

我必须在我的项目中使用 mahout。我现在不希望它安装在 hadoop 上。我可以通过 putty 访问 Linux 机器。所以我不能使用eclipse。有人可以简要指导我吗?我是这项技术的新手。我用过 Solr。我必须使用 mahout 并使其与 solr 集成。

请帮忙。

提前致谢

0 投票
2 回答
2061 浏览

hadoop - 使用 pig 或 mahout 的推荐系统

我正在以一种简单的方式在 Hadoop 上构建一个推荐系统,你能给我一个关于使用什么来构建这个推荐系统的意见吗?

我想使用 Apache pig 或 Apache mahout。

在我的数据集中我有

我有 csv 格式的数据

那么您能否建议我使用哪种技术来生成基于项目和基于用户的推荐系统。

0 投票
2 回答
618 浏览

mahout - 如何在 mahout 数据模型中获取用户偏好

我正在尝试 mahout 并想知道输入数据模型

对于非分布式版本

文件数据模型必须遵循:userid、itemid、userPreference 问题是我没有这个用户偏好值,必须预先计算它 mahout 有什么方法可以做到吗?

我找到了一篇文章http://www.codeproject.com/Articles/620717/Building-A-Recommendation-Engine-Machine-Learning 作者似乎并没有真正的用户偏好值,但他曾经org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -s SIMILARITY_COOCCURRENCE 从 {userid, questionid据我所知,mahout 似乎从数据中计算偏好值然后计算推荐,在这种情况下我是否正确?

0 投票
1 回答
1751 浏览

java - 将 Hive 与 Mahout 集成以进行推荐

我想将 mahout 与 hive 一起使用,我将从 hive 获取数据并使用数据模型来填充数据并使用 mahout 进行推荐。这可能吗。因为我已经看到 mahout 仅适用于文件。1) 如何使用 hive 表将数据加载到 mahout?2)有没有其他方法可以将 mahout 推荐与 hive 或其他人一起使用?

这里我有 hive jdbc 结果,我想填充到 mahout 中的 DataModel。如何填充?

我想使用数据库结果而不是从文件中读取 mahout 推荐。例如 :

蜂巢:

驯象师:

0 投票
2 回答
720 浏览

cassandra - 基于 Cassandra 的 Mahout 用户好友推荐

我想推荐一个用户,当前用户可以添加为朋友的用户列表。

我正在使用 Cassandra 和 mahout。在 mahout 集成包中已经有CassandraDataModel的实现。我想使用这个类。

所以我的推荐类看起来如下

}

CassandraDataModel 有 4 个列族

我很难理解这门课,尤其是专栏家庭的。有没有我可以寻找的例子,或者如果有人可以用一个小例子来解释会很棒。?

javadoc 说这个

0 投票
1 回答
1602 浏览

apache - Apache Mahout 作为推荐引擎

我想使用 Apache Mahout 作为推荐引擎;但是在这里我发现它迫使我们使用自己的名为 taste_preferences 的表,它只有 3-4 列,数据类型为数字(Long/big int)。是否必须使用此表并仅以数字格式存储数据。

0 投票
2 回答
278 浏览

hadoop - 运行 Mahout 和 Hadoop 的问题

我是Mahout和的新手Hadoop

我已经成功安装Hadoop Cluster了 3 台机器,并且集群运行良好,我只是Mahout在 Main namenode 上安装了“测试目的”,我按照安装说明进行了设置JAVA_HOME,但是当我尝试运行classify-20newsgroups.sh它时下载dataset但之后我收到以下错误:

然后我修改了.bashrc并确认JAVA_HOME设置正确,但它没有帮助。

另外,我如何验证Mahout配置为Hadoop正确运行,您是否知道任何可以验证此配置或环境的示例?

0 投票
1 回答
3040 浏览

mahout - Mahout 是否提供了一种确定内容之间相似性的方法(用于基于内容的推荐)?

Mahout 是否提供了一种确定内容之间相似性的方法?

我想生成基于内容的推荐作为 Web 应用程序的一部分。我知道 Mahout 擅长获取用户评分矩阵并根据它们生成推荐,但我对协作(基于评分)推荐不感兴趣。我想对两段文本的匹配程度进行评分,然后推荐与我在用户个人资料中为用户存储的文本最匹配的项目......

我已经阅读了 Mahout 的文档,看起来它主要促进了协作(基于评级)的推荐,而不是基于内容的推荐......这是真的吗?

0 投票
1 回答
170 浏览

mahout - 为什么 Apache Mahout ItemSimilarity 使用 LP-Space 规范化

为什么将 LP 空间归一化用于 Mahout VectorNormMapper 以获取项目相似性。还读过 2 的范数幂对 CosineSimilarity 非常有效。

是否有直观的解释来说明为什么要使用它,以及如何为给定的相似度类确定最佳的功率值。