我有一个字符串,其中包含多次出现的"<p class=a> ... </p>"
where ... 是不同的文本。
我正在使用"<p class=a>(.*)</p>"
正则表达式模式将文本分成块。但这不起作用。什么是正确的正则表达式?
PS 相同的正则表达式模式在使用 NSRegularExpression 的 iOS 中工作,但在使用 Pattern 的 android 中不起作用。
为了更多地解释我的问题:我正在做以下事情
Pattern regex3 = Pattern.compile("(?s)<P Class=ENCC>(.*?)</P>", CASE_INSENSITIVE);
String[] result = p.split(str);
结果数组仅包含 1 项,它是整个字符串
以下是我正在阅读的文件的一部分:
<BODY>
<SYNC Start=200>
<P Class=ENCC><i>Cerita, Watak, Adegan dalam</i><br/><i>Drama Ini Rekaan Semata-Mata.</i></P>
</SYNC>
<SYNC Start=2440>
<P Class=ENCC> </P>
</SYNC>
<SYNC Start=2560>
<P Class=ENCC><i>Kami Tidak Berniat</i><br/><i>Melukakan Hati Sesiapa.</i></P>
</SYNC>
<SYNC Start=4560>
<P Class=ENCC> </P>
</SYNC>
<SYNC Start=66160>
<P Class=ENCC>Hai kawan-kawan.<br/>Inilah bandaraya Banting.</P>
</SYNC>
更新 ::::
大家好,我有问题。问题实际上与我正在阅读的文件的编码有关。该文件采用 UTF-16(小端)编码。这导致正则表达式无法正常工作的所有问题。我将其更改为 UTF-8,一切都开始工作了。感谢大家的支持。