-1

我有一个对象,我想使用协议缓冲区序列化并存储在 redis 中。对象包含在java.util.regex.Pattern实例化对象时遵守的 。

public class SerializableEntity {
    private Pattern pattern;
    private List<String> options;
}

此模式用于验证对某个 api 的输入。由于每次编译模式都很昂贵,所以我在实例化期间编译一次模式,然后在每次调用 api 时重用相同的模式实例。如何Pattern在以下模式中序列化此编译字段,以便在反序列化对象时无需再次编译模式即可使用它?

 message SerializableEntityProto {
     repeated string option = 1;
     // compiled pattern
 }

谢谢。

4

2 回答 2

1

java.util.regex.Pattern本身没有实现编码和解码原型功能。但是,您可以很容易地实现它(正如 Andy Turner 建议的那样)。像这样的东西:

原型

syntax = "proto2";

package termin4t0r;
option java_package = "com.example.termin4t0r";

// Proto for java.util.regex.Pattern
message RegexPatternProto {
  // See Pattern.pattern()
  optional string pattern = 1;
  // See Pattern.flags()
  optional int64 flags = 2;
}

Java 编码和解码函数

class RegexpPatternProtos {
  public static RegexPatternProto encode(java.util.regex.Pattern pattern) {
    return RegexPatternProto.newBuilder()
        .setPattern(pattern.pattern())
        .setFlags(pattern.flags())
        .build();
  }

  public static java.util.regex.Pattern decode(RegexPatternProto patternProto) {
    return new RegexPatternProto(
      patternProto.getPattern(), patternProto.getFlags());
  }
}

我将单元测试留作练习 :) 我什至发现以这种方式序列化更可取,因为协议缓冲区具有向前和向后兼容性,而 java 序列化则存在问题。

于 2019-02-23T18:38:53.163 回答
0

我认为这是一个方钉和圆孔的情况,protobuf 和序列化并不意味着以这种方式使用。

无论如何,您似乎在每个 API 调用中都初始化了一个正则表达式。我不知道您的应用程序如何决定将哪个 Regex 用于特定 API,但您必须从 Regex 字符串开始进行编译。与其尝试序列化模式,不如将其存储在内存中HashMap<String,Pattern>(正则表达式字符串作为键,编译后的模式作为值)。然后在需要时获取模式。

于 2019-02-12T13:10:19.370 回答