1

我正在尝试在我的 Apache Flink Gelly Graph 上运行标签传播协议。
这是我的代码:

        Graph<String, Long, String> ugraph = Graph.fromDataSet(vertex, edgeSet, env).getUndirected();
        DataSet<Tuple2<String, Long>> idsWithInitialLabels = DataSetUtils
            .zipWithUniqueId(graph.getVertexIds())
            .map(new MapFunction<Tuple2<Long, String>, Tuple2<String, Long>>() {
                public Tuple2<String, Long> map(Tuple2<Long, String> tuple2) throws Exception {
                    return new Tuple2<String, Long>(tuple2.f1, tuple2.f0);
                }
            }); 
        DataSet<Vertex<String, Long>> verticesWithCommunity = graph.joinWithVertices(idsWithInitialLabels,
            new VertexJoinFunction<Long, Long>() {
            public Long vertexJoin(Long vertexValue, Long inputValue) {
            return inputValue;
        }})
    .run(new LabelPropagation<String, Long, String>(10)); 

我收到以下错误消息:

org.apache.flink.api.common.InvalidProgramException:对象 org.apache.flink.graph.Graph$ApplyCoGroupToVertexValues@4dde0543 在 org.apache.flink.api.java.ClosureCleaner.ensureSerializable(ClosureCleaner.java:99) 处不可序列化org.apache.flink.api.java.ClosureCleaner.clean(ClosureCleaner.java:61) 在 org.apache.flink.api.java.DataSet.clean(DataSet.java:186) 在 org.apache.flink.api。 java.operators.CoGroupOperator$CoGroupOperatorSets$CoGroupOperatorSetsPredicate$CoGroupOperatorWithoutFunction.with(CoGroupOperator.java:619) at org.apache.flink.graph.Graph.joinWithVertices(Graph.java:587) at tu.master.ConceptDetection.TextProcessor.clustering( TextProcessor.java:405) 在 tu.master.ConceptDetection.TextProcessor$4.actionPerformed(TextProcessor.java:210)

谢谢您的帮助 :)

4

1 回答 1

0

我猜包含您的图形代码的类不是Serializable. Java 中的匿名类实际上是非静态内部类,这意味着它们具有对包含类的引用this(请参阅此答案)。如果包含类不是Serializable,则this引用不会序列化,匿名类也不会。

这可以解释为什么切换到 lambda 表达式会使其序列化。Lambda 表达式不是匿名类,因此它们不会自动捕获隐式this引用。

它没有解释的是为什么将你声明MapFunction为匿名类仍然有效。如果你还有这段代码,@Nesrine,我会很好奇整个班级的样子。

于 2019-07-24T19:08:24.617 回答