0

我有一个带有电子邮件 ID 的文本文件,我正在读入 R(示例 1)。有时该字段为空白(示例 2)。

example 1: To: admin@naukrioverseas.com
example 2: To:

我正在使用以下代码读取数据:

to <- grep(a, pattern = "To:.*", value = T)
to <- unlist(regmatches(to, gregexpr("([_a-z0-9-]+(\\.[_a-z0-9-]+)*@[a-z0-9-]+(\\.[a-z0-9-]+)*(\\.[a-z]{2,4}))", to)))

我有类似的其他字段,例如 From、Subject 等。提取值后,我会将它们转换为数据框。

dat <-  data.frame(from, to, date, subj)

每当我有一个值不存在的文件(示例 2)时,都会获取一个长度为 0 的空字符,这会在使用它们创建数据框时引发错误。每当我得到一个空字符时,有没有办法可以强制一个像“NoID”这样的虚拟值。我尝试了以下但似乎没有改变任何东西。

to <- if(all(nchar(to) == 0)){
        to == "No mail add"
} else {
        to
}

或这个:

date <- if(is.null(date)){
        date == 0
} else {
        date
}

我可以强制一个值或 NA 以便我可以解析每个邮件 ID 吗?

4

0 回答 0