Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
有没有办法使用 Java 将 XHTML 转换为纯文本?
有人可以指导我吗?
如果您想从 XHTML 结构中提取特殊数据,请尝试jsoup。它提供了类似 jquery 的方法来提取和操作 XHTML。您可以迭代所有 html dom 元素并获取文本属性。
或者,如果您想删除 html 标签并仅保留文本,请尝试使用正则表达式。看看这个stackoverflow 线程。