我在 2.3.0 版本中使用 WSO2BAM,我在其中定义了一个在 Cassandra 数据源中保存大量数据的流。目前我的 Hive 脚本处理来自 99% 的数据是不必要的键空间的所有事件。它也占用磁盘空间。
我的想法是在这些数据变得不必要后清除它。
流的格式为:{"streamId":"kroki_i_kolejki_zlecen:1.0.0","name":"kroki_i_kolejki_zlecen","version":"1.0.0","nickName":"Kroki i kolejki zlecen","description ":"Wyniki i daty zamkniecia zlecen","payloadData":[{"name":"casenum","type":"STRING"},{"name":"type_id","type":"STRING"} ,{"name":"id_zlecenie","type":"STRING"},{"name":"sid","type":"STRING"},{"name":"step_name","type": "STRING"},{"name":"proc_name","type":"STRING"},{"name":"step_desc","type":"STRING"},{"name":"audit_date","type":"STRING"},{"name":"audit_usecs","type":"STRING"},{"name":"user_name","类型":"STRING"}]}
我的意图是在收到具有特定 payload_type_id 的事件后删除具有相同列的数据payload_id_zlecenie。在关系数据库中,它等于查询:
delete from kroki_i_kolejki_zlecen where payload_id_zlecenie = [argument];
有可能吗?