8

我正在尝试使用特定编码将 .tsv(制表符分隔值)文件读入 R。据说windows-1252是 它有一个标题。

关于将代码放入数据框中的任何建议?

4

3 回答 3

19

大概是这样的?

mydf <- read.table('thefile.txt', header=TRUE, sep="\t", fileEncoding="windows-1252")
str(mydf)
于 2012-03-19T04:33:39.063 回答
6

您还可以使用:

read.delim('thefile.txt', header= T, fileEncoding= "windows-1252")

只需将命令输入您的 R 控制台:

 > read.delim
function (file, header = TRUE, sep = "\t", quote = "\"", dec = ".", 
    fill = TRUE, comment.char = "", ...) 
read.table(file = file, header = header, sep = sep, quote = quote, 
    dec = dec, fill = fill, comment.char = comment.char, ...)

显示这read.delim是一个打包read.table命令,它已经将制表符指定为数据的分隔符。read.delim如果您正在处理大量 tsv 文件,可能会更方便。

此 Stack question中更详细地讨论了这两个命令之间的区别。

于 2013-05-29T17:12:49.370 回答
2

df <- read.delim(~/file_directory/file_name.tsv, header = TRUE)单个文件可以正常工作.tsv,因为它已经是制表符分隔的,所以不需要sep = "\t". fileEncoding= "windows-1252"可以使用但不是必须的。

于 2016-01-16T12:00:46.373 回答