-1

我正在卷曲一个网站并将其写入 .json 文件;该文件输入到我的 java 代码中,该代码使用 json 库对其进行解析,并将必要的数据写回 CSV 文件中,我稍后将使用该文件将其存储在数据库中。

如您所知,来自网站的数据可以采用不同的格式,所以我确保我以UTF-8格式读取和写入,但我仍然得到错误的输出。

例如,Østerriksk变成�sterriksk

我在 Linux 中做这一切。我认为存在一些编码问题,因为相同的代码在 Windows 中运行良好,但在 Unix/Linux 中却不行。

我很确定我的 java 代码是正确的,但我无法找出我做错了什么。

4

2 回答 2

0

您使用的是哪种 IDE,例如,如果您使用的是 Eclipse IDE,并且未在属性中将默认编码设置为 utf-8,则可能会发生这种情况。

于 2012-08-08T11:06:35.150 回答
0

您正在以 ISO 8859-1 格式读取数据,但文件实际上是 UTF-8。我认为文件阅读器有一个参数(或设置)应该可以解决这个问题。

另外: curl 不会关心编码。确实是您的 Java 代码中有问题。

于 2012-08-08T11:07:22.220 回答