我正在卷曲一个网站并将其写入 .json 文件;该文件输入到我的 java 代码中,该代码使用 json 库对其进行解析,并将必要的数据写回 CSV 文件中,我稍后将使用该文件将其存储在数据库中。
如您所知,来自网站的数据可以采用不同的格式,所以我确保我以UTF-8
格式读取和写入,但我仍然得到错误的输出。
例如,Østerriksk
变成�sterriksk
。
我在 Linux 中做这一切。我认为存在一些编码问题,因为相同的代码在 Windows 中运行良好,但在 Unix/Linux 中却不行。
我很确定我的 java 代码是正确的,但我无法找出我做错了什么。