我正在使用 AWS Kinesis Data Analytics (KDA) 服务运行 Flink 应用程序。我的 KDA Flink 应用程序最后一个检查点的大小似乎随着时间的推移而稳步增长。您可以在所附图表中看到检查点大小的突然下降,这与我将更改推送到应用程序时相对应,导致它拍摄快照、更新,然后从快照恢复。我担心的是,一旦不再积极开发应用程序,更改将不会定期部署,并且检查点大小最终可能会变得太大。
有谁知道是什么导致检查点大小不断增长而没有尽头?我在所有重要状态上使用状态 TTL,并在不再需要时删除应用程序代码中的状态。检查点大小的增加是否表明我在处理状态的代码中存在错误,或者这里可能存在其他问题?