我在记事本中有一些数据很乱。保存不同数据的任何不同列之间基本上没有空格。我知道数据的空间。例如,第 1-2 列是 X,第 7-10 列是 Y....
我该如何组织这个?可以在R中完成吗?做这个的最好方式是什么?
我在记事本中有一些数据很乱。保存不同数据的任何不同列之间基本上没有空格。我知道数据的空间。例如,第 1-2 列是 X,第 7-10 列是 Y....
我该如何组织这个?可以在R中完成吗?做这个的最好方式是什么?
?read.fwf
在这种情况下可能是一个不错的选择。
设置文件的路径:
temp <- "\pathto\file.txt"
然后设置文件中变量的宽度,如下所示。
#1-2 = x, 3-10=y
widths <- c(2,8)
然后设置列的名称。
cols <- c("X","Y")
最后,将数据导入会话中的新变量:
dataset <- read.fwf(temp,widths,header=FALSE,col.names=cols)
我过去为处理这种混乱所做的事情实际上是将其作为分隔宽度文本导入 excel,然后另存为 CSV。
只是给你一个建议。如果这是一个一次性的项目,那应该没问题。根本没有编码。但是,如果它是屡犯……那么您可能会查看正则表达式。
即 ^(.{6})(.{7})(.{2})(.{5})$ 用于 6,7,2 和 5 个字符宽度的 4 个字段,按顺序排列。