1

我有一个广泛使用德语变音符号的文件。我编写了一个脚本来处理在本机 R (RStudio) 中正常工作的文件。不幸的是,在使用 Renjin 时,所有变音符号都设置为文件字符串中的未知字符。由于文件结构的原因,我使用 readLines-command 来读取文件。在这种情况下,命令 read.table() 不是正确的解决方案。

我想使用 Renjin,因为我在 Java 团队工作,在 Renjin 的帮助下,我可以保留我们的工作环境,这当然是基于 Java 的。

Java 正确识别变音符号(使用正确的文件编码)。我还检查了 Renjin 是否正确打印了变音符号,但事实并非如此。我已经尝试将 Renjin 中的 R 语言环境设置为“German_Germany.1252”。因此我使用了以下 R 命令:

engine.eval("Sys.setlocale(category = 'LC_ALL', locale = 'German_Germany.1252')")

然后正确设置本地。但是,仁进根本不认识变音符号。我在打印文件的一行时检查了它,但也有一个字符直接传递给 Renjin(使用:)engine.eval("print('äöß')")

你知道如何解决这个问题吗?如果没有,我应该在 github 上打开一个问题吗?

4

1 回答 1

1

我怀疑这是 Renjin 尊重非 unicode 字符集的问题。

默认情况下,Renjin 在任何地方都使用 Unicode,而 UTF-8 用于读取和写入流。

如果这是不可能的,那么请在 GitHub 上使用一个小的测试文件和脚本打开一个问题。

于 2017-07-13T03:37:35.693 回答