是否有一个库可以将 HTML 解析为 String 对象,可以是 Java、C# 或任何其他编程语言。
这是我的情况:
我有一些来自所见即所得编辑器的文档,其中包含一些基本的 html 标签,例如<p><br>
:
<p>This </p><font>etc</font><br>
<span> and this, etc.
当导出到其他工具时,它会转换为纯文本,使其不可读。我现在正在做的是:“全选”>“另存为 x.html”>“在浏览器中打开”>“全选”>“粘贴”
我知道这可以通过程序自动化。
有图书馆可以做到这一点吗?也就是说,要“渲染”简单的 HTML?最好是一个字符串,我可以把它放到我的剪贴板中。删除 html 标签是不够的,因为我会得到一个很长的行而没有回车。