我有两个列表 A 和 B,A 和 B 每个包含 100 个数据帧,每个数据帧的维度是 25000 X 25000。我想通过以下方式找到整个数据帧的相关性:考虑第一个在两个列表中列出并找到 cor (A,B) 并获得与整个数据帧相关的单个值。同样考虑两个列表中的第二个列表并找到 cor(A,B) 并继续对 100 个数据帧进行此操作。
我尝试了以下方法:
A # list of 100 dataframes
$1 ### dataframe 1
$2
$3
....
$100 ### dataframe 100
B #list of 100 dataframes
$1 ### dataframe 1
$2
$3
....
$100 ### dataframe 100
C<- A[1] # extract only the first list from A
D<- B[1] # extract only the first list from B
C<-unlist(C) ### unlist C
D<-unlist(D) ## unlist D
然后计算
Correlation<- cor(C,D) ## to obtain a single correlation coefficient to see how these two vectors are correlated
但我最终得到了错误说
R cannot allocate a vector of size 3.9 GB
是否有更好的方法以更快的方式执行此操作,可以对整个列表实施。我在允许我计算大值的服务器上工作,但它仍然显示此错误,并且由于数据框的大小,取消列出需要很长时间。