1

我有一个.csv应该采用“UTF-8”编码的文件。我已经从 Sql Server Management Studio 中导出了它。但是,当将其导入到它时,R它会失败ÿ。我使用 read.csv2 并指定文件编码“UTF-8-BOM”。

Notepad++正确显示ÿ并说它是 UTF-8 编码。这是R编码的错误,还是ÿ实际上不是 UTF-8 编码方案的一部分?

我上传了一个tab delimited .txt在这里失败的小文件: https ://www.dropbox.com/s/i2d5yj8sv299bsu/TestData.txt

谢谢

4

1 回答 1

0

这可能是一开始的 BOM 标记的一部分。如果编辑器或解析器无法识别 BOM 标记,则认为它是垃圾。有关更多详细信息,请参阅https://www.ultraedit.com/support/tutorials-power-tips/ultraedit/unicode.html

于 2021-05-26T12:24:56.153 回答