我想使用 Giraph 作为我工作的图形处理工具。我熟悉 Mahout,我知道我可以在不使用 Hadoop 的情况下使用 Mahout 的某些部分,例如推荐系统。但是,我不知道这对于 Giraph 是否相同,以及我是否可以在不使用 Hadoop 的情况下使用它。
问问题
282 次
2 回答
1
您需要 Hadoop 才能运行 Giraph,因为单个任务(master 和 worker)在内部作为 map-only 作业执行。或者,您也可以将 Giraph 作为纱线应用程序运行。
如果遇到麻烦,请查看giraph 快速入门指南并搜索邮件列表。
于 2015-07-26T15:34:42.577 回答
0
您需要 Hadoop 依赖项,但不需要 Hadoop 集群,甚至不需要伪分布式集群。Practical Graph Analytics with Apache Giraph一书的第 5 章展示了一个示例 - 源代码可在GitHub 上获得。
需要以下依赖项:
- org.apache.giraph:giraph-core:1.1.0
- org.apache.hadoop:hadoop-core:1.2.1
将您的计算实现为BasicComputation
运行它的子类,如下所示:
String[] graphSeed = new String[] { "seed\t0" }
GiraphConfiguration conf = new GiraphConfiguration();
conf.setComputationClass(GenerateTwitterParallel.class);
conf.setVertexInputFormatClass(
TextDoubleDoubleAdjacencyListVertexInputFormat.class);
conf.setVertexOutputFormatClass(
AdjacencyListTextVertexOutputFormat.class);
Iterable<String> results =
InternalVertexRunner.run(conf, graphSeed);
于 2017-03-29T18:11:02.593 回答