从文本文件中读取数据(即read.table)时是否可以操作记录/观察/行分隔符?使用 sep="" 调整字段分隔符很简单,但我还没有找到一种方法来从行尾字符更改记录分隔符。
我正在尝试读取管道分隔的文本文件,其中许多条目是包含回车的长字符串。R 将这些 CR 视为行尾,这会错误地开始新行并搞砸记录数和字段顺序。
我想使用不同的分隔符而不是 CR。事实证明,每一行都以相同的字符串开头,所以如果我可以使用 \nString 之类的东西来识别真正的行尾,那么表格将正确导入。以下是其中一个文本文件可能看起来的简化示例。
V1,V2,V3,V4
String,A,5,some text
String,B,2,more text and
more text
String,B,7,some different text
String,A,,
应该读入 R 为
V1 V2 V3 V4
String A 5 some text
String B 2 more text and more text
String B 7 some different text
String A N/A N/A
我可以在文本编辑器中打开文件并在读入之前使用查找/替换来清理它们,但是 R 中的系统解决方案会很棒。谢谢你的帮助。