0

我的 Web 应用程序中有一个所见即所得的 HTML,我的用户从 Microsoft Office 复制/粘贴内容。

我需要一种 Java 方法来将办公内容(文本字符串)转换为 html 内容。

我写了代码

value = value.replaceAll("(?s)<[^>]*>(\\s*<[^>]*>)*", " ").replaceAll("\n\r", " ").replaceAll("\n", " ").replaceAll("\r", " ");
value = value.replaceAll("<xml>.*?</xml>", " ").replaceAll("<style>.*?</style>", " ").replaceAll("\n\r", "<br />").replaceAll("\n", "<br />").replaceAll("\r", "<br />").replace("id=" , "OldId=");

但这段代码没有给我正确的文本。

PS:这个网站正是我需要做的 http://word2cleanhtml.com/

4

0 回答 0