我创建了一个 Java 应用程序,它解析文本文件以提取正在加载到数据表的字段。我们发现了一些异常处理,其中表不能接受特殊字符,特别是Â
等等。
当我查看这些字符时,这些字符在输入文件中显示为空格,但 Java 对它们的解释不同。我怀疑这是一个解释不同的字符代码。
我的问题是:为了过滤掉这些字符,有什么方法可以生成 Java 所见内容的列表?我正在考虑打印 CHAR 和字符代码,如果可能的话,打印字符 ~set~(ASCII、ANSI、UTF-8 等)。由此,我可以在结束文件中为字符替换一个空格并解决我的问题。
有没有我没有看到的更简单的解决方案?