我有大量 (>1500) JSP 文件正在尝试转换为 JSPX。我正在使用一个工具来解析格式正确的 JSP 并转换为 JSPX,但是,我的 JSP 并不都是格式正确的 :)
我的解决方案是预处理 JSP 并转换不整洁的代码,以便该工具正确解析它们。我要解决的主要问题是未引用的属性值。例子:
<INPUT id="foo" size=1>
<input id=body size="2">
我当前用于查找这些的正则表达式是(Java 字符串格式):
"(\\w+)=([^\"' >]+)"
我的替换字符串是(Java 字符串格式):
"$1=\"$2\""
这很好用,除了一些模式,它们都涉及内联脚本。例如:
<INPUT id=foo value="<%= someBean.method("a=b") %>">
在这种情况下,我的模式匹配字符串文字“a=b”,我不想这样做。我想要发生的是正则表达式会忽略 <% 和 %> 之间的任何内容。是否有一个正则表达式可以做我想做的事情?
编辑:更改为标题以澄清我不是试图用正则表达式解析 HTML / JSP...我正在做一个简单的句法转换来准备解析的输入。