0

我对 R 比较陌生,我正在尝试处理存储在数据框中的大量天气数据。我的目标是遍历数据并将我的数据框的 Element 列与几个值进行比较。我计划根据 Element 的值做一些不同的事情,就像传统的 switch 语句一样。元素值可能是 24 个不同值之一,例如 TMAX 或 TMIN。目前,元素列是一个具有 24 个级别的因子。根据 Element 的值,循环运行一组不同的代码的最快方法是什么?例如,如何比较 Element 中的值以检查它是否等于 TMAX?效率非常重要。任何建议表示赞赏。

例子:

library("sqldf")
library("RPostgreSQL")

width = c(11, 4, 2, 4)
label = c("ID", "Year", "Month", "Element")
for (i in 1:31)
{
  width = c(width, 5, 1, 1, 1)
  label = c(label, paste("Value ",i), paste("MFLAG ",i), paste("QFLAG ",i), paste("SFLAG", i))
}
test = read.fwf("ftp://ftp.ncdc.noaa.gov/pub/data/ghcn/daily/all/USW00093734.dly", header = FALSE, fill = TRUE, widths = width, col.names = label)

#You need to set up your database for this to work
for(i in 1:length(test$ID))
{
  if(as.character(test$Element) == "TMAX")
  {
    for(j in 1:31)
    {
      insert_statement = paste("INSERT into noaa_temperature (id, max_temp, date) values (", test$ID[[i]],",",test[paste("Value..",j)],toString(as.Date(ISOdate(test$Year,test$Month,j))),")")
      sqldf(insert_statement)
    }
  }
  if((as.character(test$Element) == "WT01") || (as.character(test$Element) == "WT03")
  {
    for(j in 1:31)
    {
      if(test[paste("Value..",j)] == 1)
      {
        insert_statement = paste("INSERT into noaa_weather_type (id, code, date) values (", test$ID[[i]],",",toString(test$Element),toString(as.Date(ISOdate(test$Year,test$Month,j))),")")
        sqldf(insert_statement)
      }
    }
  }
}

我想根据测试中 Element 列的值在每一行上执行不同的代码部分。

4

0 回答 0