我通过以下方式跟踪了 Apache-flink 的实现:quick_start
我无法执行最后一项任务,即“分析结果”,因为 kmeans 文件夹中没有结果文件。
如果您查看上面 flink JobManager 的屏幕截图,您可以看到 KMeans Example 的 Status as FAILED。并且可能是由于此失败状态,kmeans 文件夹内没有结果文件。
现在单击 KMeans 示例,我得到以下可视化效果:
下面是异常的截图:
你能指导我我做错了什么吗?
我通过以下方式跟踪了 Apache-flink 的实现:quick_start
我无法执行最后一项任务,即“分析结果”,因为 kmeans 文件夹中没有结果文件。
如果您查看上面 flink JobManager 的屏幕截图,您可以看到 KMeans Example 的 Status as FAILED。并且可能是由于此失败状态,kmeans 文件夹内没有结果文件。
现在单击 KMeans 示例,我得到以下可视化效果:
下面是异常的截图:
你能指导我我做错了什么吗?
问题是集群已经从一个TaskManager
只有一个插槽的单个启动,并且您希望以KMeans
4 的并行度同时执行该作业。
为了以 4 的并行度运行作业,您必须增加集群的 TaskManager 数量或每个 TaskManager 上的插槽数。后者可以在 Flink 配置flink-conf.yaml
中使用taskmanager.numberOfTaskSlots: 4
. 对于前者,您可以修改conf/slaves
文件为额外的TaskManager添加新机器。
或者,您可以将作业的并行度降低到 1。您可以使用命令行选项控制并行度-p
。例如bin/flink run -p 1 -c JobClass job.tar
。