我想使用 ALS 算法在 Apache Flink 上实现实时推荐。
该模型可以预先使用 Batch 进行训练,然后加载到 Flink 中。然后应处理输入数据流并将其用于预测。
自 Flink 1.9 起不再包含库 FlinkMl。除此之外,还有很多为使用 Apache Flink 进行机器学习而设计的库。
为此,我需要一个帮助我实现这个项目的起点。
我想使用 ALS 算法在 Apache Flink 上实现实时推荐。
该模型可以预先使用 Batch 进行训练,然后加载到 Flink 中。然后应处理输入数据流并将其用于预测。
自 Flink 1.9 起不再包含库 FlinkMl。除此之外,还有很多为使用 Apache Flink 进行机器学习而设计的库。
为此,我需要一个帮助我实现这个项目的起点。
1、推荐尝试Alink。Alink是阿里巴巴计算平台PAI团队基于Flink开发的机器学习算法平台,支持ALS算法。 https://github.com/alibaba/Alink/blob/master/README.en-US.md
你会发现 README 可以更好地解释它。
2、试试Pandas?PyFlink中可以直接调用Pandas UDF/UDAF。
希望它可以帮助你。