我计划旋转我的开发集群以进行基础设施监控应用程序的趋势分析,我计划使用 Spark 构建以分析故障趋势,并使用 Cassandra 来存储传入数据和分析数据。考虑从大约 25000 台机器/服务器(可能是不同服务器上的相同应用程序集)收集性能矩阵。我期望每台机器的性能矩阵大小为 2MB/秒,我计划将其推送到具有时间戳的 Cassandra 表中,服务器作为主键和应用程序以及一些重要的矩阵作为集群键。我将在此存储信息之上运行 Spark 作业,以进行性能矩阵故障趋势分析。
谈到这个问题,考虑到上述情况,我需要多少个节点(机器)以及 CPU 和内存方面的配置来启动我的集群。