0

我是统计、R 和一般编程的新手,在被深入学习之前只上过一个短期课程。然而,我热衷于为自己解决问题。

我的首要任务是检查我收到的异常数据。我得到了一个包含 和 列的电子Date表格。我假设如果我绘制反对的每个因素,一条直线将表明没有异常,因为一次只能存在于一个地方。但是,我担心如果一个上有两个相同的,我的情节无法显示这一点。PersonIDPlaceIDPersonIDDatePersonIDPersonIDDate

我使用了简单的代码:

require(ggplot2)
qplot(Date,PersonID)

我的问题是我不确定如何将其Date纳入这个问题。本质上,我正在尝试检查 no 是否PersonID出现在多个PlaceID同一个中Date,并且已经尝试了 2 天,无法弄清楚如何将所有 3 个变量放在同一个图上。

我不是要求有人为我编写代码。我只是想知道我的思路是否正确,如果是这样,我应该如何考虑让 R 来绘制这个。有谁能够帮我?抱歉,如果这个问题相当冗长,或者张贴在错误的地方。

4

1 回答 1

1

如果您只想知道这是否发生在数据集中,请尝试duplicated()。例如,假设您的数据框被称为df

sum(duplicated(df[,c("Date","PersonID")]))

将根据列Date和数据框中的重复数返回PersonID。如果它大于零,则数据中有重复项。

于 2013-01-11T15:29:34.060 回答