不确定标题是否适合我想要实现的目标,所以请耐心等待。
我将从定义我的用例开始:
许多(比如数百万)物联网设备正在向我的 Spark 流发送数据。这些设备每 10 秒发送一次当前温度水平。所有这些物联网设备的所有者都可以定义预设规则,例如:如果温度 > 50 则执行某项操作。
我试图弄清楚如果在某个时间段内超过 50 个标准,我是否可以输出这些设备中有多少符合此条件。问题是规则是实时定义的,应该实时应用于 Spark 作业。
我该怎么做。Spark 是适合这项工作的工具吗?
非常感谢
不确定标题是否适合我想要实现的目标,所以请耐心等待。
我将从定义我的用例开始:
许多(比如数百万)物联网设备正在向我的 Spark 流发送数据。这些设备每 10 秒发送一次当前温度水平。所有这些物联网设备的所有者都可以定义预设规则,例如:如果温度 > 50 则执行某项操作。
我试图弄清楚如果在某个时间段内超过 50 个标准,我是否可以输出这些设备中有多少符合此条件。问题是规则是实时定义的,应该实时应用于 Spark 作业。
我该怎么做。Spark 是适合这项工作的工具吗?
非常感谢