1

我正在尝试遵循文档并创建一个表函数来“展平”一些数据。使用 进行展平时,表函数似乎工作正常joinLateral。但是在使用时leftOuterJoinLateral,我收到以下错误。我正在使用 Scala 并尝试了 Table API 和 SQL,结果相同:

原因:java.lang.NullPointerException:空结果不能存储在案例类中。

这是我的工作:

import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment
import org.apache.flink.table.api.scala.StreamTableEnvironment
import org.apache.flink.table.api.scala._
import org.apache.flink.streaming.api.scala._
import org.apache.flink.table.functions.TableFunction

object example_job{
  // Split the List[Int] into multiple rows
  class Split() extends TableFunction[Int] {
    def eval(nums: List[Int]): Unit = {
      nums.foreach(x =>
        if(x != 3) {
          collect(x)
      })
    }
  }

  def main(args: Array[String]): Unit = {
    val env = StreamExecutionEnvironment.createLocalEnvironment()
    val tableEnv = StreamTableEnvironment.create(env)
    val splitMe = new Split()

    // Create some dummy data
    val events: DataStream[(String, List[Int])] = env.fromElements(("simon", List(1,2,3)), ("jessica", List(3)))
    
    val table = tableEnv.fromDataStream(events, 'name, 'numbers)
      .leftOuterJoinLateral(splitMe('numbers) as 'number)
      .select('name, 'number)
    table.toAppendStream[(String, Int)].print()
    env.execute("Flink jira ticket example")
  }
}

当我更改为时.leftOuterJoinLateral.joinLateral我得到了预期的结果:

(simon,1)
(simon,2)

使用时,.leftOuterJoinLateral我会期望类似:

(simon,1)
(simon,2)
(simon,null) // or (simon, None)
(jessica,null) // or (jessica, None)

似乎这可能是 Scala API 的错误?我想在提出罚单之前先检查这里,以防我做一些愚蠢的事情!

4

1 回答 1

1

问题是 Flink 默认情况下确实期望一行的所有字段都是非空的。这就是程序在看到null外连接操作的结果时失败的原因。为了接受null值,您需要通过禁用空检查

val tableConfig = tableEnv.getConfig
tableConfig.setNullCheck(false)

或者您必须指定结果类型以容忍空值,例如指定自定义 POJO 输出类型:

table.toAppendStream[MyOutput].print()

class MyOutput(var name: String, var number: Integer) {
  def this() {
    this(null, null)
  }

  override def toString: String = s"($name, $number)"
}
于 2019-10-14T16:20:30.593 回答