我有一个用例,我想用 Java 中的 Flink 实现 AWS Kinesis Data Application。它将通过 Data Streams API 监听多个 Kinesis 流。但是,这些流的分析将在 Python 中完成(因为我们的数据科学家更喜欢 Python)。
从这个答案,似乎支持从 Java 调用 Python UDF。但是,我希望能够将传入流转换为表格,通过
StreamTableEnvironment tableEnv = StreamTableEnvironment.create(env);
Table sessionsTable = tableEnv.fromDataStream(inputStream);
...然后有一个 Python 处理器被调用来处理该流。
我真的有3个问题:
- 这是受支持的用例吗?
- 如果是这样,是否有描述如何执行此操作的文档?
- 如果是这样,这是否会给应用程序增加大量开销?