11

我很难在数据框和动物园对象之间切换,特别是保持有意义的列名,以及单变量和多变量情况之间的不一致:

library(zoo)

#sample data, two species counts over time
t = as.Date(c("2012-01-01", "2012-01-02", "2012-01-03", "2012-01-04"))
n1 = c(4, 5, 9, 7)  #counts of Lepisma saccharina
n2 = c(2, 6, 0, 11) #counts of Thermobia domestica
df = data.frame(t, n1, n2)
colnames(df) <- c("Date", "Lepisma saccharina", "Thermobia domestica")

#converting to zoo loses column names in univariate case...
> z1 <- read.zoo(df[,1:2]) #time series for L. saccharina
> colnames(z1)
NULL
> colnames(z1) <- c("Lepisma saccharina") #can't even set column name manually
Error in `colnames<-`(`*tmp*`, value = "Lepisma saccharina") : 
  attempt to set colnames on object with less than two dimensions
#... but not in multivariate case
> z2 <- read.zoo(df) #time series for both species
> colnames(z2)
[1] "Lepisma saccharina"  "Thermobia domestica"

要从动物园对象返回原始格式的数据框,使用它是不够的,as.data.frame因为它不包含日期列(日期在行名中结束):需要做更多的工作。

zooToDf <- function(z) {
    df <- as.data.frame(z) 
    df$Date <- time(z) #create a Date column
    rownames(df) <- NULL #so row names not filled with dates
    df <- df[,c(ncol(df), 1:(ncol(df)-1))] #reorder columns so Date first
    return(df)
}

这在多变量情况下效果很好,但在单变量情况下显然无法恢复有意义的列名:

> df2b <- zooToDf(z2)
> df2b
        Date Lepisma saccharina Thermobia domestica
1 2012-01-01                  4                   2
2 2012-01-02                  5                   6
3 2012-01-03                  9                   0
4 2012-01-04                  7                  11

> df1b <- zooToDf(z1)
> df1b
        Date z
1 2012-01-01 4
2 2012-01-02 5
3 2012-01-03 9
4 2012-01-04 7

有没有一种简单的方法来处理变量多变量的情况?似乎z1需要以某种方式记住列名。

4

5 回答 5

16

如果您不想删除尺寸,请使用drop=FALSE

R> (z1 <- read.zoo(df[,1:2], drop=FALSE))
           Lepisma saccharina
2012-01-01                  4
2012-01-02                  5
2012-01-03                  9
2012-01-04                  7

如果您write.zoo想将动物园索引作为列包含在 data.frame 中,您可以执行以下操作:

zoo.to.data.frame <- function(x, index.name="Date") {
  stopifnot(is.zoo(x))
  xn <- if(is.null(dim(x))) deparse(substitute(x)) else colnames(x)
  setNames(data.frame(index(x), x, row.names=NULL), c(index.name,xn))
}

更新:

为了简洁起见,在尝试编辑您的问题后,我想到了一种根据您的规格创建的简单方法(如果您不删除尺寸df2b,这也适用):z1

R> (df2b <- data.frame(Date=time(z2), z2, check.names=FALSE, row.names=NULL))
        Date Lepisma saccharina Thermobia domestica
1 2012-01-01                  4                   2
2 2012-01-02                  5                   6
3 2012-01-03                  9                   0
4 2012-01-04                  7                  11
于 2012-12-28T04:36:38.360 回答
5

要将数据框转换为动物园,请使用read.zoo

library(zoo)
z <- read.zoo(df)

drop还要注意 中的和其他参数的可用性?read.zoo

并从动物园转换为数据框,包括索引,使用fortify.zoo

fortify.zoo(z, name = "Date")

(如果加载了 ggplot2,那么您可以使用fortify.)

如问题下方的评论中所述,该问题以及其他一些答案要么已过时,要么存在一些重大误解。建议您查看https://cran.r-project.org/web/packages/zoo/vignettes/zoo-design.pdf讨论动物园的设计理念,其中包括与 R 本身的一致性。如果你必须记住 R 的一组默认值和 zoo 的另一组默认值,当然 zoo 会更难使用。

于 2019-06-12T13:48:10.283 回答
2

使用包有一个更新的简单解决方案timetk。它将转换几种时间序列格式,包括xtsand zoo,到tibbles。只需换as.data.frame行即可获得数据框。

timetk::tk_tbl(zoo::read.zoo(df))
# A tibble: 4 x 3
  index      `Lepisma saccharina` `Thermobia domestica`
  <date>                    <dbl>                 <dbl>
1 2012-01-01                    4                     2
2 2012-01-02                    5                     6
3 2012-01-03                    9                     0
4 2012-01-04                    7                    11
于 2019-06-11T22:59:09.153 回答
0

您可以简单地创建一个新数据集并添加 as.data.frame 来包装 fortify.zoo。这应该会有所帮助。z2=as.data.frame(fortify.zoo(z, name = "Date"))

于 2019-07-05T05:50:44.777 回答
0

我想绕一圈。首先,将动物园写入 csv 文件,然后再次将其读取到 data.frame。默认情况下,索引列将命名为“索引”,但您可以使用参数更改它。

library(zoo)
date <-
  seq.Date(
    from = as.Date("2017-01-01"),
    to = as.Date("2017-01-10"),
    by = "days"
  )
value <- seq.int(from = 100, to = length(date))
vzoo <- zoo(value, date)
write.zoo(
  vzoo,
  index.name = "Date",
  file = "tmp.txt",
  sep = ",",
  col.names = TRUE
)
vzoo.df <- read.csv("tmp.txt", sep = ',')
于 2017-01-19T20:27:49.970 回答