我有一个要解析的文档,它包含 html,我想将其转换为 from html
toplaintext
但有格式。
示例摘录
<p>My simple paragragh</p>
<p>My paragragh with <a>Link</a></p>
<p>My paragragh with an <img/></p>
我可以很容易地做这个简单的例子(也许不是很有效)
StringBuilder sb = new StringBuilder();
for(Element element : doc.getAllElements()){
if(element.tag().getName().equals("p")){
sb.append(element.text());
sb.append("\n\n");
}
}
是否有可能(以及我将如何做)在正确的位置插入内联元素的输出。一个例子:
<p>My paragragh with <a>Link</a> in the middle</p>
会成为:
My paragragh with (Location: http://mylink.com) in the middle