在过去的 20 年里,已经在一个国家的很多地方进行了一系列野生动物计数。当检测到一个物种时,将记录个体数量以及位置、年份等。如果未检测到一个物种,则不计入计数(即使检测到该物种为 0 也不包括在内)。
我有两个数据表。一张包含所有计数数据(即每年在哪个位置看到每种物种的数量)和一张表,其中包含每次计数的地点和时间。我认为要在此数据集上运行任何有意义的统计数据,我需要在不同年份在该位置检测到一个物种时,在每年和位置添加一个 0 计数。
例如,如果我有一个从 2003 年到 2008 年运行的数据集,并且在 2004 年、2005 年、2006 年和 2008 年在位置 B 检测到物种 A,我想为 2003 年和 2007 年在位置 B 的物种 A 添加计数.
有没有自动的方法来做到这一点?我的数据集大约有 34000 行,因此手动执行此操作可能需要数周时间并且容易出错。
本质上,我想知道是否有一种方法可以对每年/物种/位置组合的所有计数进行比较,并将它们与我的数据表进行比较,详细说明每年和位置,然后对于一年中未找到的每个位置/年份进行计数/species/location 组合添加一行,其中包含年份/物种/位置和计数为 0。理想情况下,这仅适用于在 20 年数据中的某个时间点检测到该物种的地方。有些物种永远不会在某些地区被发现,因此没有必要为这些物种计算这些地方的数量。
任何帮助,将不胜感激。