我一直无法解决 Java Unicode 和编码的问题。问题是我有 5,000 多个字符串,例如:“Steve O#8217Conord and Mirco Savas”和...“Rusell O’Connell”,其中“#8217”和“’”必须用撇号替换。
但是此代码有许多不同的变体,apache.common.lang.StringUtils
Apache 库并没有帮助我解决问题,因为该库需要以“&”字符开头和“;” 在末尾。我不能到处输入这些,因为有超过 5,000 个字符串。因此,如果有任何方法使用正则表达式或其他方法在字符串中找到这些序列并用撇号替换它们,我会很高兴听到它:)
此外,还有一些像“O’”这样的符号,它们是一个大问题,因为它们应该以 UTF8 格式读取。我的意思是像 (\u8127) 和其他字符。你有什么建议吗?