我有一个大型数据集(> 100 万条记录),我从中提取了 Date、SiteID、SubstrateID 和 WinterID。我称之为dailyWinter
。下面,我只显示前四个记录。每个日期定义一个 WinterID。十月不是冬天,因此是“NA”。
Date SiteID SubstrateID WinterID
1 2002-10-08 NW_SB B <NA>
2 2002-10-08 NW_SB B <NA>
3 2002-10-08 NW_SB B <NA>
4 2002-10-08 NW_SB B <NA>
我有另一个数据框dataSummary
(下面的前四个记录)。
Date SiteID SubstrateID dailyMean dailyMedian dailySD dailyP05 dailyP25 dailyP75 dailyP95 dailyMin dailyMax dailyRange dailyCount dailyTH16 dailyTH18 dailyTH20
1 10/08/2002 NW_SB B 29.7885 30 0.4737452 29.0705 29.395 30 30.3795 28.89 30.56 1.67 20 0 0 0
2 10/09/2002 NW_SB B 29.8275 29.535 0.608278 29.215 29.26 30.37 30.94 29.08 31.13 2.05 36 0 0 0
3 10/10/2002 NW_SB B 29.8680 29.63 0.5425591 29.26 29.44 30.37 30.76 29.26 30.94 1.68 36 0 0 0
4 10/11/2002 NW_SB B 30.3838 30.095 0.8461519 29.44 29.63 31.18 31.72 29.44 31.72 2.28 36 0 0 0
dailyWinter
我需要日期框架中包含的数据框架中的 WinterID 字段,dailySummary
但我只想要每个日期的一个 WinterID 记录,而不是多个日期(因为它在dailyWinter
数据框架中)。我尝试使用:
dailySummaryFinal <- merge(dataSummary, dailyWinterID, by = c("Date", "SiteID", "SubstrateID"))
这返回dailySummaryFinal
包含具有相同信息的多个日期,因为它的大小与dailyWinterID
.
如何获取该WinterID
字段,dataSummary
以便每个日期有一行?我是 R 和这个论坛的新手。感谢您提供的任何帮助。