我正在尝试使用 Presto 的 HyperLogLog 的输出。我已经从 Airflow 的 Dense(v1 和 v2)实现中克隆了序列化/反序列化过程。此外,我的测试具有与原始 Java 代码相同的输入。
我遇到的问题是查询的输出对于查询如下所示SELECT
CAST(EMPTY_APPROX_SET() as P4HYPERLOGLOG)
:
AwwAAAAAAAA ...
(更长)但它应该以 4 以下的字节开始,指示要使用的版本。当然其余的字符串也和我找到的代码不一致。
它可能与输出的编码有关吗?或者任何人都可以告诉我在哪里对序列化进行了转换?
欢迎任何帮助,谢谢!