想知道其他人如何应对这一挑战。
背景
数据用于植被监测。它包括每个地块的基本信息,并确定这些物种的物种和覆盖率。
有几行特定于地块的信息 - 日期、位置、距离,然后是物种行。在物种行中,值包括该列所代表的地块中物种的覆盖百分比。
简化的视图将是这样的网格:
plot 1 4 5
date 5/3/2016 6/20/2016 6/22/2016
location A F K
sp1 15 30
sp2 5 100
sp3 T 3 5
我希望得到的是这样的网格,它可以将 csv 导入数据库(物种 % 覆盖率需要参考 RMDB 中的绘图信息)。最左边的列 = 表字段名称。
plot 1 1 4 4 5 5 5
date 5/3/2016 5/3/2016 6/20/2016 6/20/2016 6/22/2016 6/22/2016 6/22/2016
location A A F F K K K
species sp2 sp3 sp1 sp3 sp1 sp2 sp3
cover % 5 T 15 3 30 100 5
这种宽格式可以很容易地被数据库“消化”并正确填充两个表(Plot 和 CoverPercent)。
方法?
我已经想到了几种方法,但我认为我缺少更好的方法。
到目前为止,这是我想出的:
将数据从长翻转到宽
添加一个
species
和cover
行计算给定地块的物种数量
根据物种数量重复绘图的列
填充情节的“物种”和“封面”行
最初我以为我可以在 VBA 中做到这一点,但似乎 R 是一种更好/更快/更清洁的方法。问题是“如何”?
我最近使用 table 包完成了一些 R 工作,但在过去的一年中,我确实对 VBA/SQL 项目感到生疏。
我很好奇其他人会如何处理这种变化。有什么想法吗?