我有一个 java 程序,目前我正在使用正则表达式来替换 HTML 文档中的任何术语,并且工作正常。
Pattern p = Pattern.compile(links);
Matcher m = p.matcher(text);
RegexText = m.replaceAll("ReplacementString");
但是,如果单词被部分格式化为富文本标签,则不会匹配。例如。测试_
<b>tes</b>ting
在这种情况下,单词“testing”不匹配,因为“tes”是粗体文本。
有什么方法可以替换被这样的标签破坏的单词。同样重要的是,我不会丢失单词上的富文本格式,因此仅剥离标签而不将它们插入回正确的位置不是一种选择。