我想要一个正则表达式来找出特定的 html 标签详细信息。
我尝试了以下 2 正则表达式:
<\s*tag[^>]*>(.*?)<\s*/\s*tag>
<tag[^<>]*>.+?<\/tag>
下面是第一个正则表达式的2 个测试用例 :
在第一个示例中,我得到了正确的结果,但在示例 2中,我得到了错误的结果。在这两种情况下,输入几乎相同。
第一种情况:全部作为单个字符串,第二种情况:作为单个字符串。
===================================
Example 1 Input
===================================
<tagX>AAA</tagX>
<tag>GGG</tag>
<tag id="tag896">HHH</tag>
<tagY>III</tagY>
<tag id="tag017">JJJ</tag>
<tag>KKK</tag>
===================================
Output 1 // Correct
===================================
<tag>GGG</tag>
GGG
<tag id="tag896">HHH</tag>
HHH
<tag id="tag017">JJJ</tag>
JJJ
<tag>KKK</tag>
KKK
===================================
Example 2 Input (as a single string)
===================================
<tagX>AAA</tagX><tag>GGG</tag><tag id="tag896">HHH</tag><tagY>III</tagY><tag id="tag017">JJJ</tag><tag>KKK</tag>
===================================
Output 2 // Wrong
===================================
<tagX>AAA</tagX><tag>GGG</tag>
AAA</tagX><tag>GGG
<tag id="tag896">HHH</tag>
HHH
<tagY>III</tagY><tag id="tag017">JJJ</tag>
III</tagY><tag id="tag017">JJJ
<tag>KKK</tag>
KKK
这里正是我想要(tag)的详细信息,但在第二种情况下,它获取(tag) + (tagX) + (tagY) 的详细信息。
我的输入类似于第二输入...
它的小紧急......我能得到一个解决方案吗?
谢谢...