2

我有以下字符串,我想MBRB1045T4G用 Java 中的正则表达式过滤掉它。我将如何实现这一目标?

细绳:

<p class="ref">
<b>Mfr Part#:</b>
MBRB1045T4G<br>


<b>Technologie:</b>&nbsp;
    Tab Mount<br>



<b>Bauform:</b>&nbsp;
    D2PAK-3<br>



<b>Verpackungsart:</b>&nbsp;
    REEL<br>



<b>Standard Verpackungseinheit:</b>&nbsp;
    800<br>

4

1 回答 1

3

正如 Wrikken 正确所说,在一般情况下,正则表达式无法正确解析 HTML。但是,您似乎正在查看一个实际的网站并想要抓取一些内容。在这种情况下,假设 HTML 代码中的空格元素和格式不变,您可以使用如下正则表达式:

 Mfr Part#:</b>([^<]+)<br>

并像这样收集第一个捕获组(string您的 HTML 在哪里):

Pattern pt = Pattern.compile("Mfr Part#:</b>\s+([^<]+)<br>",Pattern.MULTILINE);
Matcher m = pt.matcher(string); 
if (m.matches())
    System.out.println(m.group(1)); 
于 2012-05-08T16:43:35.617 回答