所以,我仍然是一个 REGEX 假人,过去 2 天才使用它们。但是,至少对我来说,我的问题似乎很奇怪。
以下模式为我正确匹配此字符串:
<td valign=3D\"top\">For:</td>(\\s)+(=)?(.|\r\n|\n)+<td>(([a-z]|[A-Z]|=|\\s)+)<br>
原始字符串(取自作为输入提供给正则表达式的 html 文档):
<td valign=3D"top">For:</td> = <td>XXXXXX XXXXX<br>
和匹配的字符串:
<td valign=3D"top">For:</td> = <td>XXXXXX XXXXX<br>
但是对于这个字符串:
<td valign=3D"top">For:</td> <td>YYYYYYY= YYYYY<br>
它匹配整个 html 文档。我不明白为什么会这样,因为在我(([a-z]|[A-Z]|=|\\s)+
指定应该有一个<br>
标签之后