我有一个带有电子邮件 ID 的文本文件,我正在读入 R(示例 1)。有时该字段为空白(示例 2)。
example 1: To: admin@naukrioverseas.com
example 2: To:
我正在使用以下代码读取数据:
to <- grep(a, pattern = "To:.*", value = T)
to <- unlist(regmatches(to, gregexpr("([_a-z0-9-]+(\\.[_a-z0-9-]+)*@[a-z0-9-]+(\\.[a-z0-9-]+)*(\\.[a-z]{2,4}))", to)))
我有类似的其他字段,例如 From、Subject 等。提取值后,我会将它们转换为数据框。
dat <- data.frame(from, to, date, subj)
每当我有一个值不存在的文件(示例 2)时,都会获取一个长度为 0 的空字符,这会在使用它们创建数据框时引发错误。每当我得到一个空字符时,有没有办法可以强制一个像“NoID”这样的虚拟值。我尝试了以下但似乎没有改变任何东西。
to <- if(all(nchar(to) == 0)){
to == "No mail add"
} else {
to
}
或这个:
date <- if(is.null(date)){
date == 0
} else {
date
}
我可以强制一个值或 NA 以便我可以解析每个邮件 ID 吗?