0

我试图找到一种基于某些字符串的出现快速清理大型数据集的方法。我有一个如下所示的 data.frame:

created_at  actor_attributes_email      type
3/11/12 7:28    jeremy@asynk.ch         Event
3/11/12 7:28    jeremy@asynk.ch         PushEvent
3/11/12 7:28    jeremy@asynk.ch         PushEvent
3/11/12 7:42    jeremy@asynk.ch         IssueCommentEvent
3/11/12 11:06   d.bussink@gmail.com     PushEvent
3/11/12 11:06   d.bussink@gmail.com     PushEvent

您可以在此处找到完整的 CSV 。

我正在为“在 R 中查找和删除”编写命令:

# Load CSV file
events.raw <- read.csv(file = "input.csv", header = TRUE)

# Delete events called "Event"
events.raw.new <- events.raw[!grepl("Event", events.raw$type, fixed = TRUE),]

我的代码现在删除了每一行,我不太确定,因为我使用的是 fixed = TRUE 参数。我想要的是删除“Event”是完整字符串的所有行,因为它是每一行中的子字符串。如何限制我的代码以完成字符串?

4

1 回答 1

0

这个问题的一个答案是:

events.raw <- subset(events.raw, type!="Event")

但是,这并不能解决问题

events.raw.new <- events.raw[!grepl("Event", events.raw$type, fixed = TRUE),]

没有达到同样的目的。

于 2012-12-13T00:53:51.253 回答