r - R中的强制值

翻译自：https://stackoverflow.com/questions/33592314 2015-11-08T09:02:19.413

49 次

我有一个带有电子邮件 ID 的文本文件，我正在读入 R（示例 1）。有时该字段为空白（示例 2）。

example 1: To: admin@naukrioverseas.com
example 2: To:

我正在使用以下代码读取数据：

to <- grep(a, pattern = "To:.*", value = T)
to <- unlist(regmatches(to, gregexpr("([_a-z0-9-]+(\\.[_a-z0-9-]+)*@[a-z0-9-]+(\\.[a-z0-9-]+)*(\\.[a-z]{2,4}))", to)))

我有类似的其他字段，例如 From、Subject 等。提取值后，我会将它们转换为数据框。

dat <-  data.frame(from, to, date, subj)

每当我有一个值不存在的文件（示例 2）时，都会获取一个长度为 0 的空字符，这会在使用它们创建数据框时引发错误。每当我得到一个空字符时，有没有办法可以强制一个像“NoID”这样的虚拟值。我尝试了以下但似乎没有改变任何东西。

to <- if(all(nchar(to) == 0)){
        to == "No mail add"
} else {
        to
}

或这个：

date <- if(is.null(date)){
        date == 0
} else {
        date
}

我可以强制一个值或 NA 以便我可以解析每个邮件 ID 吗？

r - R中的强制值

0 回答 0

Related

Reference