0

我有一个包含 id、纬度、经度列的数据框。我需要找到附近的气象站并使用 RNOAA 下载数据。第一步是使用meteo_nearby_stations 获取站名,然后使用meteo_pull_monitors 下载数据。

我的问题是,如何在meteo_pull_monitors 的结果中保留来自df 的站点ID?

期望的结果可以在这里看到

library(rnoaa)
id<-c("07227500", "07308500", "07311700")
latitude<-c(35.47033,34.11009,  33.82064)
longitude<-c(101.87963,98.53172,-99.78648)
df<-data.frame(id,latitude,longitude)

met_test<-meteo_nearby_stations(df, lat_colname = "latitude",
      lon_colname = "longitude", station_data = ghcnd_stations(),
      var = c("TMAX","TMIN"), year_min = NULL, year_max = NULL, 
      radius = 200, limit = 3)
met_test_df<-do.call(rbind, lapply(met_test,as.data.frame))
met_id<-as.vector(met_test_df$id)
met_data<-meteo_pull_monitors(met_id, var = c("date","TMAX","TMIN"), date_min = "2020-01-01", date_max = "2020-06-01")
4

1 回答 1

1

我们可以通过拉取列表中每个元素的名称来将site_id数据连接到函数的结果中。meteo_nearby_stations()met_test

library(rnoaa)
id<-c("07227500", "07308500", "07311700")
latitude<-c(35.47033,34.11009,  33.82064)
longitude<-c(101.87963,98.53172,-99.78648)
df<-data.frame(id,latitude,longitude)

met_test<-meteo_nearby_stations(df, lat_colname = "latitude",
                                lon_colname = "longitude", station_data = ghcnd_stations(),
                                var = c("TMAX","TMIN"), year_min = NULL, year_max = NULL, 
                                radius = 200, limit = 3)

幸运的是,每个元素都met_list包含与请求site_id关联的名称。meter_nearby_stations()我们可以使用names()函数访问这些信息。

> names(met_test)
[1] "07227500" "07308500" "07311700"
> 

为了合并站点标识符,我们修改了do.call()原始帖子中的函数以包含lapply()一个匿名函数,该函数将列表中的正确名称分配给我们命名的列site_id。请注意,为了遍历数据帧列表并访问它们的名称,我们使用向量1:length(met_test)来驱动lapply()函数,并包含met_test作为第二个参数,这样我们就可以使用索引号x来访问正确的列表元素及其名称.

met_test_df<-do.call(rbind, lapply(1:length(met_test),function(x,y){
     data <- as.data.frame(y[[x]])
     # note individual data frames already have an ID variable
     data$site_id <- names(y)[x]
     data
},met_test))
met_test_df

...和输出:

> met_test_df
           id             name latitude longitude   distance  site_id
1 CHM00052955           GUINAN  35.5830  100.7500 102.990626 07227500
2 CHM00056080            HEZUO  35.0000  102.9000 106.410602 07227500
3 CHM00052957           TONGDE  35.2700  100.6500 113.695195 07227500
4 CHM00056033            MADOI  34.9170   98.2170  94.243943 07308500
5 CHM00056046           DARLAG  33.7500   99.6500 110.669503 07308500
6 CHM00056029            YUSHU  33.0000   96.9670 190.415441 07308500
7 USC00419163     TRUSCOTT 3 W  33.7569  -99.8617   9.927467 07311700
8 USC00411995 COPPER BREAKS SP  34.1122  -99.7430  32.667020 07311700
9 USC00417572        RHINELAND  33.5333  -99.6500  34.356103 07311700
> 

此时我们可以提取单个监视器数据,并site_id通过监视器 id 合并数字。首先,我们提取监控数据。

met_id<-as.vector(met_test_df$id)
met_data<-meteo_pull_monitors(met_id, var = c("date","TMAX","TMIN"), date_min = "2020-01-01", date_max = "2020-06-01")

然后,我们合并站点标识符数据。

sites <- met_test_df[,c("id","site_id")]
mergedData <- merge(met_data,sites)

最后,我们打印结果数据帧的前几行。

head(mergedData)

           id       date tmax tmin  site_id
1 CHM00052955 2020-01-01   81 -193 07227500
2 CHM00052955 2020-01-02   81 -163 07227500
3 CHM00052955 2020-01-03   54 -155 07227500
4 CHM00052955 2020-01-04   62 -127 07227500
5 CHM00052955 2020-01-05   62 -149 07227500
6 CHM00052955 2020-01-06    3 -216 07227500
> 
于 2020-06-23T22:29:15.627 回答