我发现我的数据框中的一些字符串包含隐藏的换行符,尽管我不能确切地知道是哪个(当加载到 gVim 时,它们只是显示为换行符)。以下代码:
gsub("[\r\n]", "", x)
成功地从字符串中删除换行符。但是,它还删除了分隔单元格的换行符,使我的数据框是原子的而不是递归的。如何在保持数据框完整的同时仅针对字符串中的换行符?
以下是数据示例:
我发现我的数据框中的一些字符串包含隐藏的换行符,尽管我不能确切地知道是哪个(当加载到 gVim 时,它们只是显示为换行符)。以下代码:
gsub("[\r\n]", "", x)
成功地从字符串中删除换行符。但是,它还删除了分隔单元格的换行符,使我的数据框是原子的而不是递归的。如何在保持数据框完整的同时仅针对字符串中的换行符?
以下是数据示例:
复制上面的评论以结束问题,
dataframe <- data.frame(ID = 1:2, Name = 'XX',
string_column = c('Hi \r\nyou\r\n', 'Always \r\nshare\r\n some \r\nsample\r\n data!'))
dataframe$string_column
#> [1] Hi \r\nyou\r\n
#> [2] Always \r\nshare\r\n some \r\nsample\r\n data!
#> Levels: Always \r\nshare\r\n some \r\nsample\r\n data! Hi \r\nyou\r\n
dataframe$string_column <- sapply(dataframe$string_column,
function(x) { gsub("[\r\n]", "", x) })
dataframe$string_column
#> [1] "Hi you" "Always share some sample data!"