4

对于我的单元测试,我想找到一个无法匹配UriComponentsBuilder#URI_PATTERNSpring MVC 3.1.1 的正则表达式的无效 URI 示例:

private static final String SCHEME_PATTERN = "([^:/?#]+):";

private static final String HTTP_PATTERN = "(http|https):";

private static final String USERINFO_PATTERN = "([^@/]*)";

private static final String HOST_PATTERN = "([^/?#:]*)";

private static final String PORT_PATTERN = "(\\d*)";

private static final String PATH_PATTERN = "([^?#]*)";

private static final String QUERY_PATTERN = "([^#]*)";

private static final String LAST_PATTERN = "(.*)";

// Regex patterns that matches URIs. See RFC 3986, appendix B
private static final Pattern URI_PATTERN = Pattern.compile(
        "^(" + SCHEME_PATTERN + ")?" + "(//(" + USERINFO_PATTERN + "@)?" + HOST_PATTERN + "(:" + PORT_PATTERN +
                ")?" + ")?" + PATH_PATTERN + "(\\?" + QUERY_PATTERN + ")?" + "(#" + LAST_PATTERN + ")?");

我正在努力寻找一个会导致UriComponentsBuilder.fromUriString()失败的字符串IllegalArgumentException。我尝试的任何东西都通过正则表达式检查作为有效的 URI。

4

1 回答 1

3

我认为任何东西都会匹配那个正则表达式。问题是正则表达式没有严格执行 RFC。相反,它被设计为允许的;即接受任何旧垃圾并尽最大努力将其解析为 URL。

(但是,我注意到它在解析非 HTTP URI 方面做得并不好。看看 SCHEME_PATTERN……然后哭泣。)

如果您想对 URI 进行严格的解析或验证,最好使用java.net.URI. 正则表达式不是此任务的正确工具。

于 2012-02-27T05:30:15.657 回答