目前我正在研究一个数据集,我想知道哪些区域具有相同的模式。为了澄清这一点,我制作了一个输入数据集和一个输出数据集。
# Input data:
Region F1 F2 F3
1 A 1 2 3
2 B 1 2 2
3 B 1 2 2
4 A 1 2 3
5 B 3 2 1
6 C 1 2 2
7 C 1 2 3
8 C 3 2 1
9 D 3 2 1
# Output data:
F1 F2 F3 Number_Pattern Name_Region Total_Region
1 1 2 3 3 A, C 2
2 1 2 2 3 B, C 2
3 3 2 1 3 B, C, D 3
到目前为止,我只计算了输入数据集中有多少模式。我无法通过数字和名称(例如输出数据)获取模式背后的特征区域。
library(dplyr)
# Input data
input <- data.frame(
Region = c('A', 'B', 'B', 'A', 'B', 'C', 'C', 'C', 'D'),
F1 = c(1, 1, 1, 1, 3, 1, 1, 3, 3),
F2 = c(2, 2, 2, 2, 2, 2, 2, 2, 2),
F3 = c(3, 2, 2, 3, 1, 2, 3, 1, 1)
)
output <- input %>%
select(Region, F1, F2, F3) %>%
group_by(F1, F2, F3) %>%
dplyr::summarise(Number_Pattern =n(), .groups ='drop')