我正在使用SNAP数据集进行社交网络分析。SNAP 使用简单边列表作为数据格式。如何在 Apache Giraph 中读取 SNAP 数据集?
问问题
488 次
3 回答
1
据我所知,SNAP 有多种数据格式,具体取决于您正在查看的数据集。如果您正在查看的数据集的格式为 :sourceid destinationid
在每一行上,那么您可能想要使用 IntNullTextEdgeInputFormat (它位于giraph-core/src/main/java/org/apache/giraph/io/formats
)。
另请查看同一文件夹中可用的各种预定义格式。如果这些都不适合您的数据集格式,那么您可以编写自己的输入格式类(如果您从预定义的格式开始并根据需要进行编辑,这将非常简单)。
于 2014-07-23T19:31:29.883 回答
0
使用 -eif org.apache.giraph.io.formats.IntNullTextEdgeInputFormat
于 2015-05-27T12:42:47.940 回答
0
是的,SNAP 使用简单边列表格式来表示图形数据库。您可以使用此代码将其转换为 Apache Giraph 接受的 JSON 格式。
于 2016-06-13T21:28:04.447 回答