0

我必须使用 Java 解码包含以下实体的 HTML 字符串:“'”和“&apos”。我正在使用Apache Commons Lang,但它不会解码这两个实体,因此,我目前正在执行以下操作,但我正在寻找最快的方法来做我想做的事。

import org.apache.commons.lang.StringEscapeUtils;

public class StringUtil {

        public static String decodeHTMLString(String s) {
            return StringEscapeUtils.unescapeHtml((s.replace("'", "`").replace("'", "'")));
        }

}

我搜索了较旧的问题,但似乎没有人回答我的问题。

4

1 回答 1

2

好吧,我想问题的一部分是您的一个实体是双重编码的:“ '”。任何解码器都不会将其变成撇号。

至于“ '”,显然它不是+技术+ html实体集的一部分。

于 2010-10-21T17:13:21.517 回答