0

请帮助我.. 我的环境有 Fluentd(tdagent) 服务器,它从 130 个服务器(类型:转发,in_tail,缓冲区类型:文件)获取日志。批处理的时机,许多日志切换发生在一个特定的服务器上,并导致其他服务器上的数百条消息如下。

a) slow_flush_log_threshold b) 提交超时 c) 节点没有响应 d) 刷新缓冲区失败

我发现收到的日志服务器在当时显示了这些功能,如下所示

  1. “netstat -s”的结果是…… 250774 次套接字的监听队列溢出 250774 SYN 到 LISTEN 套接字被丢弃
  2. ss -ant '(sport = 61501) 每十秒执行一次,它显示 LISTEN Recv-Q 保持 129 (= limit(128)+1)。

所以我的问题是

  1. 我想这是因为接收端 tdagent 比它获得的数据大小太慢,所以我怎样才能提高接收端的性能。(我已将 flush_tread_count 1 更改为 3,但不起作用)
  2. 或者有什么想法可以解决这个问题。
  3. 我可以忽略它,如果我能找到我们丢失日志的时间(我的意思是可以忽略它是否只是性能问题而不是数据丢失)。是否有任何特定的错误消息显示我们丢失日志的情况。
4

0 回答 0