2

我正在研究一个研究案例,该案例包括为实时流处理问题提出技术架构。问题是一家运输公司想要近乎实时地跟踪其公交车上的速度和乘客数量。我提出的初始架构是这样的:

  1. 总线将数据实时发送到 MQQT 服务器
  2. Apache Kafka 通过 MQQT 连接器从该服务器获取数据
  3. 使用 Kafka Streams API 或 Spark 流计算“速度”和“乘客数量”
  4. “速度”和“乘客数量”的可视化。

我的问题如下

  • 架构,对吗?
  • 这种情况下的流处理问题,是无状态的吗?
  • 最后,我想知道在进行可视化之前是否必须将数据存储在像 cassandra 这样的中间数据库中?
  • 如果没有,是否有可以直接与运动中的流交互的开源可视化工具?
4

0 回答 0