当我解析本地 HTML 文件时,jsoup 将锚元素内的引号更改为 & 模糊我的 HTML。
假设我想在以下 HTML 部分中将值“一”更改为“二”:
<div class="pg2-txt1">
<a class="foo" appareantly_a_javascript_statement='{"targetId":"pg1-magn1", "ordinal":1}'>one</a>
</div>
我得到的是:
<div class="pg2-txt1">
<a class="foo" appareantly_a_javascript_statement="{"targetId":"pg1-magn1", "ordinal":1}">two</a>
</div>
锚元素内的引号是必需的。我的代码现在看起来像这样:
File input = new File("D:/javatest/page02.html");
Document doc = Jsoup.parse(input, "UTF-8");
Element div = doc.select("div.pg2-txt1").first(); //anchor element only identifyable by parent <div> class
div.child(0).text("one"); //actual anchor element
我试过了
doc.outputSettings().prettyPrint(false);
没有成功。
我可以用jsoup实现这个吗?我是否必须使用不同的解析器,它会是什么样子。
非常感谢您提前。