2

我有一个大型数据集(> 100 万条记录),我从中提取了 Date、SiteID、SubstrateID 和 WinterID。我称之为dailyWinter。下面,我只显示前四个记录。每个日期定义一个 WinterID。十月不是冬天,因此是“NA”。

        Date SiteID SubstrateID WinterID
1 2002-10-08  NW_SB           B     <NA>
2 2002-10-08  NW_SB           B     <NA>
3 2002-10-08  NW_SB           B     <NA>
4 2002-10-08  NW_SB           B     <NA>

我有另一个数据框dataSummary(下面的前四个记录)。

          Date SiteID   SubstrateID dailyMean   dailyMedian dailySD     dailyP05    dailyP25    dailyP75    dailyP95    dailyMin    dailyMax    dailyRange  dailyCount  dailyTH16   dailyTH18   dailyTH20
1   10/08/2002  NW_SB             B 29.7885     30          0.4737452   29.0705     29.395      30          30.3795     28.89       30.56       1.67        20          0           0           0
2   10/09/2002  NW_SB             B 29.8275     29.535      0.608278    29.215      29.26       30.37       30.94       29.08       31.13       2.05        36          0           0           0
3   10/10/2002  NW_SB             B 29.8680     29.63       0.5425591   29.26       29.44       30.37       30.76       29.26       30.94       1.68        36          0           0           0
4   10/11/2002  NW_SB             B 30.3838     30.095      0.8461519   29.44       29.63       31.18       31.72       29.44       31.72       2.28        36          0           0           0

dailyWinter我需要日期框架中包含的数据框架中的 WinterID 字段,dailySummary但我只想要每个日期的一个 WinterID 记录,而不是多个日期(因为它在dailyWinter数据框架中)。我尝试使用:

dailySummaryFinal <- merge(dataSummary, dailyWinterID, by = c("Date", "SiteID", "SubstrateID"))

这返回dailySummaryFinal包含具有相同信息的多个日期,因为它的大小与dailyWinterID.

如何获取该WinterID字段,dataSummary以便每个日期有一行?我是 R 和这个论坛的新手。感谢您提供的任何帮助。

4

0 回答 0