问题标签 [flinkml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1637 浏览

apache-flink - FlinkML 的现状如何?

最近没有看到太多关于 FlinkML 的讨论——它是死了还是死了?

最近一些有趣的现场用法有哪些例子?

0 投票
1 回答
789 浏览

python - 在 apache flink 中嵌入现有的 ML 模型

我们正在离线训练机器学习模型并将它们保存在 python pickle 文件中。

我们想知道将这些腌制模型嵌入到流中的最佳方法(例如 sensorInputStream > PredictionJob > OutputStream.

Apache Flink ML 似乎是使用流数据训练模型而不是引用现有模型的正确选择。

谢谢你的回复。

亲切的问候 Lomungo

0 投票
1 回答
173 浏览

apache-flink - 将 PyFlink 与 LightGBM 一起使用

是否可以将 PyFlink 与 LightGBM 等 Python 机器学习库一起用于流应用程序?这有什么好的例子吗?

0 投票
1 回答
57 浏览

apache-flink - how can I get job submitting time and use it in Flink application?

I'm currently developing a stream processing application, one of the functionality is to take events that happen in the time zone [time of submitting the job, time of submitting the job + T ].

how can access to that particular variable (time of submitting the job) with stream processing APIs in Flink?

Thank you.

0 投票
1 回答
292 浏览

apache-flink - flink k8s ha 出现错误。作业 00000000000000000000000000000000 不是处于 RUNNING 状态而是 SCHEDULED 状态。中止检查点

当我将 flink 作业应用于 k8s zookeeper ha 时,出现以下错误。

我们的结构是工作集群。1 个工作和 1 个任务。我们希望在删除作业 pod 的同时执行任务仍然可以继续工作。

下面是我的conf

以下是错误日志:

0 投票
1 回答
190 浏览

apache-flink - Apache Flink 从文件加载 ML 模型

我想知道是否有办法(或某种代码示例)在 Flink 流应用程序中加载编码的预训练模型(用 python 编写)。所以我可以使用从文件系统加载的权重和来自流的数据来拟合模型。

先感谢您

0 投票
1 回答
139 浏览

apache-flink - ALS 实时推荐 Apache Flink

我想使用 ALS 算法在 Apache Flink 上实现实时推荐。

该模型可以预先使用 Batch 进行训练,然后加载到 Flink 中。然后应处理输入数据流并将其用于预测。

自 Flink 1.9 起不再包含库 FlinkMl。除此之外,还有很多为使用 Apache Flink 进行机器学习而设计的库。

为此,我需要一个帮助我实现这个项目的起点。

0 投票
0 回答
92 浏览

apache-flink - Pyflink windowAll() 按事件时间应用聚类模型

我是 pyflink 框架的初学者,我想知道我的用例是否可以使用它......

我需要制作一个翻滚窗口并在其上应用 python udf(scikit 学习聚类模型)。用例是:每 30 秒我想在前 30 秒的数据上应用我的 udf。

目前,我成功地在流中使用了来自 kafka 的数据,但是我无法使用 python API 在非键控流上创建 30 秒窗口。

你知道我的用例的一些例子吗?你知道 pyflink API 是否允许这样做吗?

这是我的第一枪:

谢谢