问题标签 [mahout]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2373 浏览

java - 如何使用 hadoop 安装执行 mahout

我试图弄清楚如何使用 hadoop 运行 mahout jar 示例。我配置了 mahout 和 hadoop,现在我进入 hadoop 目录并输入如下内容:

/Users/hadoop/hadoop-0.20.2/bin/hadoop jar /Users/hadoop/trunk/examples/mahout-examples-0.5-SNAPSHOT-job.jar org.apache.mahout.SpareVectorsFromSequenceFile -w -i ratings -o ratings_vectors

但我正在尝试,我的目标是为 Grouplens 数据集运行 hadoop 作业。我执行了 put 命令将我的 rating.dat 上传到 Hadoop,然后呢?该命令总是给我这样的东西:

我的问题是:

  • 如何在 hadoop 目录中设置正确的路径来调用 mahout?
  • 如何使用org.apache.mahout.cf.taste.example.grouplens.GroupLensRecommenderEvaluatorRunnerhadoop 计算我的数据 rating.dat?

非常感谢,我从 hadoop 和 mahout 开始;)

0 投票
2 回答
6674 浏览

apache - 使用 Apache Mahout 对数据进行分类

我正在尝试解决一个简单的分类问题。

问题:
我有一组文本,我必须根据内容对它们进行分类。

使用 Mahout 的解决方案:
我知道我必须将输入转换为序列文件才能生成模型。是的,我能够做到这一点。现在,如何对测试数据进行分类?20News 示例仅测试正确性。但是,我想做实际的分类。
我不确定是否需要编写代码或使用一些现有的类来对测试集进行分类。?

0 投票
2 回答
535 浏览

java - 使用 mahout 数学类创建矩阵的问题

我正在使用 Math MAhout 类 DoubleMatrix2d 创建一个 3x4 矩阵,我写了这样的东西开始:

我收到有关编译的错误,但我需要知道的第一件事是这样做是否正确:) 谢谢!

0 投票
1 回答
468 浏览

apache - 从 Apache Mahout LDA 包访问 LDA 参数

我刚刚测试了使用 Apache Mahout 在 30 个文档的语料库上构建潜在狄利克雷分配模型。我没有在系统上安装 Hadoop,这就是为什么本地执行 Mahout 会产生结果模型的原因。我想访问模型参数,如估计的 \alpha、\beta、\Phi、\Theta

我怎样才能访问这些?

/mahout lda -i /tf-vectors -o -k 4-v 27

我可以看到学习算法的每次迭代(我假设)都有文件夹。每个都有一个文件 part-r-0000,我不知道如何访问。

任何帮助将不胜感激。

0 投票
6 回答
5172 浏览

hadoop - 是否值得购买 Mahout in Action 以快速了解 Mahout,还是有其他更好的来源?

我目前是Apache Mahout的一个非常随意的用户,我正在考虑购买Mahout in Action这本书。不幸的是,我很难理解这本书的价值——因为这是一本曼宁早期访问计划的书(因此目前只能作为测试版电子书提供),我可以不要自己去书店看看。

任何人都可以将其推荐为一个好的(或不太好的)指南,以快速了解 Mahout 和/或其他可以补充 Mahout 网站的资源吗?

0 投票
3 回答
9541 浏览

hadoop - 使用 mahout 和 hadoop

我是一个新手,试图了解 mahout 和 hadoop 将如何用于协同过滤。我有单节点 cassandra 设置。我想从 cassandra 获取数据

我在哪里可以找到明确的 hadoop 安装步骤,然后是 mahout 以使用 cassandra?

0 投票
3 回答
1137 浏览

python - 我的 boto 弹性 mapreduce jar 工作流参数有什么问题?

我正在使用 boto 库在 Amazons Elastic MapReduce Webservice (EMR) 中创建工作流。以下代码应创建一个步骤:

当我运行作业流程时,它总是无法抛出此错误:

这是 EMR 日志中调用 java 代码的行:

参数有什么问题?java类定义可以在这里找到:

https://hudson.apache.org/hudson/job/Mahout-Quality/javadoc/org/apache/mahout/cf/taste/hadoop/similarity/item/ItemSimilarityJob.html

0 投票
5 回答
1089 浏览

machine-learning - 机器学习平台的选择

我有一个用户数据集和他们的贷款还款指标(他们花了多长时间,分期付款多少等)。现在我想分析用户过去的贷款历史并说,“如果我们借给他们 X,他们很可能会在 Z 天内分期偿还 Y”

这是我的看法

  1. 该算法是一种聚类算法,根据用户的还款习惯对所有用户进行分组
  2. 我想使用 SOM 或 K-Means

所以我的问题是,哪些平台对此有好处?到目前为止,我已经看过 Mahout。

0 投票
5 回答
10195 浏览

java - Python 中 Java 的 Mahout 等价物

基于 Java 的 Mahout 的目标是构建可扩展的机器学习库。Python中是否有任何等效的库?

0 投票
1 回答
357 浏览

extraction - 是否可以使用 Mahout 进行术语提取?

是否可以使用 Apache Mahout 进行术语提取?该术语可以是单词或短语。