8

可能重复:
Java:如何在 Java 中解码 HTML 字符实体,如 HttpUtility.HtmlDecode?

我需要title从文件中提取段落(如在 StackOverflow 中)html

我可以使用 Java 中的正则表达式来提取我需要的字段,但我必须得到decode这些字段。

例子

提取的字段:

Paging Lucene&#39s search results (with **;** among **&#39** and **s**)

解码后的字段:

Paging Lucene's search results

java中是否有任何类可以让我转换这些html代码?

4

2 回答 2

30

Apache Commons Lang提供的使用方法

import org.apache.commons.lang.StringEscapeUtils;
// ...
String afterDecoding = StringEscapeUtils.unescapeHtml(beforeDecoding);
于 2012-12-06T18:41:15.360 回答
3
于 2012-12-06T19:12:07.117 回答