r - R中的UTF-8文件编码

Question

我有一个.csv应该采用“UTF-8”编码的文件。我已经从 Sql Server Management Studio 中导出了它。但是，当将其导入到它时，R它会失败ÿ。我使用 read.csv2 并指定文件编码“UTF-8-BOM”。

Notepad++正确显示ÿ并说它是 UTF-8 编码。这是R编码的错误，还是ÿ实际上不是 UTF-8 编码方案的一部分？

我上传了一个tab delimited .txt在这里失败的小文件： https ://www.dropbox.com/s/i2d5yj8sv299bsu/TestData.txt

谢谢

score 0 · Accepted Answer

这可能是一开始的 BOM 标记的一部分。如果编辑器或解析器无法识别 BOM 标记，则认为它是垃圾。有关更多详细信息，请参阅https://www.ultraedit.com/support/tutorials-power-tips/ultraedit/unicode.html。

1 回答 1