0

我想使用 Giraph 作为我工作的图形处理工具。我熟悉 Mahout,我知道我可以在不使用 Hadoop 的情况下使用 Mahout 的某些部分,例如推荐系统。但是,我不知道这对于 Giraph 是否相同,以及我是否可以在不使用 Hadoop 的情况下使用它。

4

2 回答 2

1

您需要 Hadoop 才能运行 Giraph,因为单个任务(master 和 worker)在内部作为 map-only 作业执行。或者,您也可以将 Giraph 作为纱线应用程序运行。

如果遇到麻烦,请查看giraph 快速入门指南并搜索邮件列表。

于 2015-07-26T15:34:42.577 回答
0

您需要 Hadoop 依赖项,但不需要 Hadoop 集群,甚至不需要伪分布式集群。Practical Graph Analytics with Apache Giraph一书的第 5 章展示了一个示例 - 源代码可在GitHub 上获得。

需要以下依赖项:

  • org.apache.giraph:giraph-core:1.1.0
  • org.apache.hadoop:hadoop-core:1.2.1

将您的计算实现为BasicComputation运行它的子类,如下所示

String[] graphSeed = new String[] { "seed\t0" }

GiraphConfiguration conf = new GiraphConfiguration();
conf.setComputationClass(GenerateTwitterParallel.class);
conf.setVertexInputFormatClass(
    TextDoubleDoubleAdjacencyListVertexInputFormat.class);
conf.setVertexOutputFormatClass(
    AdjacencyListTextVertexOutputFormat.class);
Iterable<String> results =
    InternalVertexRunner.run(conf, graphSeed);
于 2017-03-29T18:11:02.593 回答