我正在检查不同数据集之间发生的变化,现在我正在使用一个简单的循环来计算每个变化的计数。数据集是数字的(数字序列),我计算每次更改发生的次数(1 更改为 5 XX 次):
n=100
tmp1<-sample(1:25, n, replace=T)
tmp2<-sample(1:25, n, replace=T)
values_tmp1=sort(unique(tmp1))
values_tmp2=sort(unique(tmp2))
count=c()
i=1
for (m in 1:length(values_tmp1)){
for (j in 1:length(values_tmp2)){
count[i]=length(which(tmp1==values_tmp1[m] & tmp2==values_tmp2[j]))
i=i+1
}
}
但是,使用n = 2000000时,我的数据要大得多,并且循环变得非常慢。
谁能帮我改进这个计算?