我在导入到 R 的 excel 电子表格中有 7 个不同的变量。它们都是大小为 3331 的列。它们是:
'Tribe' - there are 8 of them
'Month' - when the sampling was carried out
'Year' - the year when the sampling was carried out
'ID" - an identifier for each snail
'Weight' - weight of a snail in grams
'Length' - length of a snail shell in millimetres
'Width' - width of a snail shell in millimetres
这是一个案例,要求 8 个不同的部落记录疑似濒临灭绝的蜗牛物种的数据,以查看它们是否变得越来越稀有,或者大小或重量是否发生变化。这发生在 1993 年至 1998 年间的不同频率。
我想知道如何能够为数据创建一个新变量,以便如果我输入名称(蜗牛)# 那么它会列出 7 个给定变量以及我拥有的任何添加的变量。
数据集仅限于我想添加新变量的地方。例如,了解任何给定月份中每月的蜗牛数量。
这将取决于我使用 - 部落、月份、年份和 ID。如果根据任何给定月份的费率列出了 ID(蜗牛标识符),那么我将能够将它们相加以查看计数是否有任何变化。我努力了:
count=c(Tribe,Year,Month,ID)
count
但是,在做完这样的事情之后,R 只是有一个大列表,其大小是数据集大小的 4 倍。我希望能够创建一个列大小为 n=3331 的给定新变量。
或者,也许我想创建一个更简单的变量,以便查看某个部落是否在任何给定月份收集。我不知道我该怎么做。
我查看了其他论坛并进行了搜索,但是在我的情况下,我看不到任何对我有帮助的东西。我很感激任何帮助。谢谢