我正在尝试将一些包含相关顶点信息的文本文件读入 Giraph:每一行都是
vertex_id 属性_1 属性_2 .....attribute_n
其中每个属性都是一个字符串。
目标是创建一个顶点,其中所有这些属性都是顶点值的一部分。
查找各种输入格式我找不到任何开箱即用的东西,所以我假设我必须从VertexValueInputFormat派生我的顶点输入类(我有一个单独的边缘阅读器)。
问题是:如何?我创建了一个包含 String[] 数组的 Value 类,但是如何将它交给 Giraph/Hadoop?这是单行的阅读器:
protected abstract V getValue(org.apache.hadoop.io.Text line)
当时的想法是, V 将是一个ArrayWritable,但似乎不喜欢它。
有什么线索吗?谢谢