我对 JSoup 有以下问题。
我想解析和修改以下html代码:
<code>
<style type="text/css" media="all">
@import url("http://hakkon-aetterni.at/modules/system/system.base.css?ll3lgd");
@import url("http://hakkon-aetterni.at/modules/system/system.menus.css?ll3lgd");
@import url("http://hakkon-aetterni.at/modules/system/system.messages.css?ll3lgd");
@import url("http://hakkon-aetterni.at/modules/system/system.theme.css?ll3lgd");
</style>
</code>
我正在使用以下代码来实现这一目标:
Elements cssImports= doc.select("style");
for (Element src : cssImports) {
String regex ="url\\(\"(.)*\"\\)";
String data =src.data();
String link;
Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(data);
while (m.find()){
link=m.group().substring(5,m.group().length()-2);
doc=Jsoup.parse(doc.html().replace(link, ""));
}
}
首先,它有效。所有导入 url 都替换为字符串“ FOUND
”。我遇到的问题是我在最后一个导入语句和</style>
之前没有的封闭标签之间有很多新行。
任何线索为什么会发生这种情况以及如何避免它?
抱歉格式错误,但我的代码的某些部分似乎刚刚在发布时被删除。第一个代码块周围有一个样式标签...