0

我面临一个非常困难的问题,如下:

我有许多 HTML 格式的字符串。它们由 Document-Element 生成,其中文本在 RTF 中编辑并保存在 HTML 中(以在网站上显示)。

现在的问题是,一些解析为 HTML 的 RTF 元素似乎在 html 中无法使用,这导致它崩溃。html 中不允许的字符之一是例如%0b

根据http://www.tutorialspoint.com/html/html_url_encoding.htm它没有功能,或者我不知道为什么需要它(事实上,它甚至不可复制)。

我现在的问题是:是否有一个函数(我已经搜索过)能够消除这种格式化的 rtf2html 字符串的所有非 html 字符?

我只需要在加载 html 时消除它们,因此没有任何显示问题

4

1 回答 1

0

Apache Commons Lang 提供的使用方法

import org.apache.commons.lang.StringEscapeUtils;
String afterDecoding = StringEscapeUtils.unescapeHtml(beforeDecoding);

归功于:@jlordo

或者你可以使用replaceAll("%0b", "");

于 2013-10-16T11:14:42.437 回答