0

假设我有两列,一列位置,一列日期,其中一些缺失。

    City       Date
1   Sheffield  19/05/1985
2   Sheffield  21/06/1986
3   Sheffield  <NA>
4   Newcastle  14/07/1996
5   Newcastle  <NA>
6   Liverpool  12/11/2001

我需要用虚拟日期(比如 1866 年 6 月 21 日)替换缺失的日期,但仅限于谢菲尔德市。

在 SQL 中,语法为:

UPDATE Dataframe SET Date = "21/06/1866" WHERE city="Sheffield"

在 R 中,我尝试了以下有限(甚至没有)成功:

filter <- (Dataframe$Date == is.na(Dataframe$Date) & Dataframe$City =="Sheffield")
Dataframe[filter,"Date"] <- as.Date("1866/06/21")

但是,这会引发以下错误:

[<-.data.frame( , filter, "Date", value = -37814) 中的错误*tmp*:数据帧的下标分配中不允许缺失值

有人有什么想法吗?我觉得这可能非常容易,但我只是还没有看到它是如何完成的。

4

1 回答 1

0
df[df$City == "Sheffield" & is.na(df$Date), "Date"] = as.Date("1866/06/21", format = "%Y/%m/%d")

> df
       City       Date
1 Sheffield 1985-05-19
2 Sheffield 1986-06-21
3 Sheffield 1866-06-21
4 Newcastle 1996-07-14
5 Newcastle       <NA>
6 Liverpool 2001-11-12

如果您查看过滤器,它只会一直返回 FALSE。

> filter <- (df$Date == is.na(df$Date) & df$City =="Sheffield")
> filter
[1] FALSE FALSE FALSE FALSE FALSE FALSE

您只需要编写is.na(df$Date)这将返回一个逻辑向量,指示日期是否为 NA。你写的日期检查是 TRUE 或 FALSE(从 中返回is.na(df$Date)),它永远不会是因为它是一个日期。

> filter <- (is.na(df$Date) & df$City =="Sheffield")
> filter
[1] FALSE FALSE  TRUE FALSE FALSE FALSE
于 2017-05-10T17:19:41.527 回答