目前我们有火花结构化流
在箭头文档中,我找到了箭头流,我们可以在其中使用 Python 创建流、生成数据并使用StreamReader
Java/Scala 使用流
我想知道这两者是否集成在一起,我们可以在其中做一些事情,比如在 Python 中生成箭头流并使用 spark 结构化流来获取流(以分布式方式)?
想象一个场景,想要构建一个易于使用的 Python api,但计算引擎是在 Java/Scala 上,使用 Kafka/Redis 无法解决跨语言的数据类型。但是使用箭头目前没有集群支持来访问数据