我正在尝试使用 Flume 将我的访问日志发送到 Spark 集群。但是有很多限制迫使我编写自定义应用程序(或 Flume 源)来读取日志文件。
我要做的是让 Flume 客户端向这个源发出信号,以防它无法将数据写入接收器。由于我们经常有长时间的网络中断,并且没有足够的磁盘空间来排队磁盘上的失败日志,直到网络备份。相反,我想“告诉”源停止阅读日志,直到网络启动,然后“告诉”它重新开始。但到目前为止,我还没有在文档中看到任何关于错误的回调。
无论如何我可以在不重新发明轮子的情况下实现这种情况吗?