我正在尝试将数据从另一台服务器流式传输到 HBase,并能够在 Python 中定义不同的列族。我在 Spark 文档中环顾四周,只看到:
writestream.format('jdbc').start('jdbc:///')
我怎样才能有相同的实现直接写入 HBase 并能够将数据映射到不同的列族?
我正在尝试将数据从另一台服务器流式传输到 HBase,并能够在 Python 中定义不同的列族。我在 Spark 文档中环顾四周,只看到:
writestream.format('jdbc').start('jdbc:///')
我怎样才能有相同的实现直接写入 HBase 并能够将数据映射到不同的列族?
foreach
您可以使用(Scala 或 Java)将数据写入 HBase :http: //spark.apache.org/docs/latest/structured-streaming-programming-guide.html#using-foreach