3

渔业数据通常由每年 1 月 1 日开始的统计周收集。第二周从每年的下一个星期日开始。

所以在 2013 年 1 月 1 日到 1 月 5 日是第 1 周,1 月 6 日到 1 月 12 日是第 2 周。我正在尝试计算给定日期的静态周数年。我的数据只是 dmy 格式的日期(即 16-6-1990),我想要 R 代码中的统计周输出。

一个例子是:

> d <- as.Date(c("01-01-2013","06-01-2013","01-01-2006","08-01-2006"),"%d-%m-%Y")

期望的结果是:

> statweek(d)
[1] 1 2 1 2
4

2 回答 2

4

尝试这个:

> d <- as.Date("01-01-2013", "%d-%m-%Y") + 0:7  # first 8 days of 2013
> d
[1] "2013-01-01" "2013-01-02" "2013-01-03" "2013-01-04" "2013-01-05"
[6] "2013-01-06" "2013-01-07" "2013-01-08"
> 
> ufmt <- function(x) as.numeric(format(as.Date(x), "%U"))
> ufmt(d) - ufmt(cut(d, "year")) + 1
[1] 1 1 1 1 1 2 2 2

注意:一年中的第一个星期日被定义为第 1 周的开始,%U这意味着如果一年不是从星期日开始,那么我们必须将一周加 1,以便第一周是第 1 周而不是第 0 周。 ufmt(cut(d, "year"))等于一个 ifd的年份从星期日开始,否则为零,因此上面的公式简化为ufmt(d)if d 的年份从星期日开始,ufmt(d)+1如果不是。

更新:更正所以 Jan 从第 1 周开始,即使年份从星期日开始,例如 2006 年。

于 2013-06-25T00:58:47.830 回答
1

这是statweek功能。主要参数可以是日期的字符向量(例如,读取 data.frame 后的默认值)。您可以指定日期的格式(有默认值format="%d-%m-%Y":)

d1 <- c("01-01-2013","06-01-2013","01-01-2006","08-01-2006") # format="%d-%m-%Y"
d2 <- c("01/01/2013","06/01/2013","01/01/2006","08/01/2006") # format="%d/%m/%Y"

statweek = function(dates, format="%d-%m-%Y", ...) {
  # convert to Date
  dates = as.Date(dates, format=format, ...) 
  # get correction for the first week of the year (0 if 1-Jan not a Sunday)
  firstweek = 1 - as.numeric(format(as.Date(cut(dates, "year")), "%U")) 
  output = as.numeric(format(dates, "%U")) + firstweek
  return(output)
}

和例子:

statweek(d1)

[1] 1 2 1 2

statweek(d1, format="%d-%m-%Y")

[1] 1 2 1 2

statweek(d2, format="%d/%m/%Y")

[1] 1 2 1 2

于 2013-06-25T04:44:00.723 回答