0

我有一个包含图像标签的字符串,超过 1 个。现在我需要正则表达式输出alt=标签。我试过这样:

while (m3.find()) {
    Pattern p4 = Pattern.compile("<!\\[CDATA\\[(.*?)\\]\\]>");
    Matcher m4 = p4.matcher(m3.group());

    while (m4.find()) {
         if(m4.group().contains("<img src")) {
            Pattern p6 = Pattern.compile("<img src(.*?)/>");
        Matcher m6 = p6.matcher(m4.group());

        while (m6.find()) {
                Pattern p7 = Pattern.compile("alt=\"(.*?)\"");
                Matcher m7 = p7.matcher(m6.group());

            while (m7.find()) {
messages.add(m4.group().replace(m6.group(), m7.group().replace("alt=",  "").replace("\"", "")).replace("<![CDATA[", "").replace("]]>", ""));
                                } 
                            }
                        } else {
                            messages.add(m4.group().replace("<![CDATA[", "").replace("]]>", ""));
                        }
                    }
                }

问题是:有超过 1 个图像标签。messages是一个数组列表。messages.add对于实际消息中的所有图像,我只需要 1 个。代码本身做了一些非常不同的事情,我不知道如何修复它或我的错误在哪里:/我只想用 的内容替换整个内容alt="...",但每个实际消息都包含。谁能帮我?

4

1 回答 1

0

也许你应该使用像jsoup这样的第三方库,它允许以 jquery 方式解析、提取和修改 html 文档。使用这个库,更改某些 html 元素的属性(如这里所解释的)应该像这样工作:

Document doc = Jsoup.parse(html);
doc.select("div.comments a").attr("rel", "nofollow");
于 2013-04-25T23:03:58.447 回答