目前我正在用java中的等效字符转换HTML代码。我需要将下面的代码转换为字符。
è - è
® - ®
& - &
ñ - ñ
& - &
我尝试使用正则表达式模式
(&#x)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)(;)
当我调试时,matcher.find()
给了我,true
但控件跳过了我编写转换代码的循环。不知道那里发生了什么。
另外,有没有办法优化这个正则表达式?
任何帮助表示赞赏。
例外
java.lang.NumberFormatException: For input string: "x26"
at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at org.apache.commons.lang.Entities.unescape(Entities.java:683)
at org.apache.commons.lang.StringEscapeUtils.unescapeHtml(StringEscapeUtils.java:483)