我试图找到一种基于某些字符串的出现快速清理大型数据集的方法。我有一个如下所示的 data.frame:
created_at actor_attributes_email type
3/11/12 7:28 jeremy@asynk.ch Event
3/11/12 7:28 jeremy@asynk.ch PushEvent
3/11/12 7:28 jeremy@asynk.ch PushEvent
3/11/12 7:42 jeremy@asynk.ch IssueCommentEvent
3/11/12 11:06 d.bussink@gmail.com PushEvent
3/11/12 11:06 d.bussink@gmail.com PushEvent
您可以在此处找到完整的 CSV 。
我正在为“在 R 中查找和删除”编写命令:
# Load CSV file
events.raw <- read.csv(file = "input.csv", header = TRUE)
# Delete events called "Event"
events.raw.new <- events.raw[!grepl("Event", events.raw$type, fixed = TRUE),]
我的代码现在删除了每一行,我不太确定,因为我使用的是 fixed = TRUE 参数。我想要的是删除“Event”是完整字符串的所有行,因为它是每一行中的子字符串。如何限制我的代码以完成字符串?