1

我正在 Ubuntu Linux 上编写一个 java 应用程序,它读取一个文本文件并从数据创建一个 xml 文件。一些文本包含弯撇号和引号,我使用以下代码将它们转换为直撇号和引号:

dataLine = dataLine.replaceAll( "[\u2018|\u2019]", "\u0027" ).replaceAll( "[\u201C|\u201D]", "\u005c\u0022" );

这很好用,但是当我将 jar 文件移植到 Mac OSX 机器时,我得到三个问号,我应该得到直撇号和引号。我在 Mac 上创建了一个测试应用程序,使用相同的代码行进行转换,并使用相同的测试文件进行输入,它运行良好。为什么Linux机器上创建的jar文件在Mac上不能正常工作?我认为java应该是跨平台兼容的。

4

1 回答 1

2

您可能一开始就没有正确读取文件。你还没有展示你是如何读取文件的,但我你只是在使用FileReader,或者InputStreamReader没有指定编码。在这种情况下,将使用默认平台编码 - 如果这不是文件的实际编码,您将不会读取正确的字符。您应该能够在不进行任何替换的情况下检测到这一点。

相反,您应该使用 aFileInputStream并将其包装在InputStreamReader具有正确编码的 an 中——这很可能是 UTF-8,因为它是 XML。(您应该能够轻松地检查这一点。)

于 2013-09-25T22:51:24.103 回答