1

我正在使用SNAP数据集进行社交网络分析。SNAP 使用简单边列表作为数据格式。如何在 Apache Giraph 中读取 SNAP 数据集?

4

3 回答 3

1

据我所知,SNAP 有多种数据格式,具体取决于您正在查看的数据集。如果您正在查看的数据集的格式为 :sourceid destinationid在每一行上,那么您可能想要使用 IntNullTextEdgeInputFormat (它位于giraph-core/src/main/java/org/apache/giraph/io/formats)。

另请查看同一文件夹中可用的各种预定义格式。如果这些都不适合您的数据集格式,那么您可以编写自己的输入格式类(如果您从预定义的格式开始并根据需要进行编辑,这将非常简单)。

于 2014-07-23T19:31:29.883 回答
0

使用 -eif org.apache.giraph.io.formats.IntNullTextEdgeInputFormat

于 2015-05-27T12:42:47.940 回答
0

是的,SNAP 使用简单边列表格式来表示图形数据库。您可以使用此代码将其转换为 Apache Giraph 接受的 JSON 格式。

于 2016-06-13T21:28:04.447 回答