我正在运行一个 3 节点 Storm 集群。我们正在提交一个包含 10 个工作人员的拓扑,以下是拓扑详细信息
拓扑细节:
kafkaspout: 1 (with 10 kafka partions and 10 executors)
no of bolt: 4 (with bolt1 - 30 executors,bolt2 - 50 executors, bolt3 - 80 executors and bolt4 has 100 executors)
kafka spout pending : 500 messages
我们每天处理 8 到 1000 万个数据。问题是 Toplolgy 只运行了 2 到 3 天,而我们在 kafka spout 中看到一些失败的元组并且没有处理任何消息。提交新拓扑时它工作正常,但在 2 中再次运行或 3 天我们看到同样的问题。有人可以为我们提供解决方案。下面是我的风暴配置
风暴.yaml:
worker.childopts: "-Xmx3072m -XX:-UseGCOverheadLimit -server -XX:+AggressiveOpts -XX:+UseCompressedOops -Djava.net.preferIPv4Stack=true -XX:MaxTenuringThreshold=1 -XX:SurvivorRatio=6 -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:+CMSParallelRemarkEnabled -XX:CMSInitiatingOccupancyFraction=75 -XX:+UseCMSInitiatingOccupancyOnly"
storm.zookeeper.servers:
- "zoo1"
- "zoo2"
- "zoo3"
storm.zookeeper.port: 2181
ui.port: 9095
ui.host: uihost
nimbus.host: "nimbushost"
storm.local.dir: "/storm-logs"
supervisor.slots.ports:
- 6700
- 6701
- 6702
- 6703
- 6704
- 6705
- 6706
- 6707
- 6708
- 6709