1

我正在尝试big.matrix使用 using进行一些操作RcppArmadillo。问题是我总是需要保持我的结果以big.matrix避免将数据加载到 RAM 中。这是我创建 a 转置的代码big.matrix

big_T.cpp

#define ARMA_NO_DEBUG

#include <RcppArmadillo.h>
// [[Rcpp::depends(RcppArmadillo, BH, bigmemory)]]

using namespace Rcpp;
using namespace arma;

#include <bigmemory/BigMatrix.h>
#include <bigmemory/MatrixAccessor.hpp>

// [[Rcpp::plugins(cpp11)]]


// [[Rcpp::export]]
bool BigArmaT(SEXP pBigMat,SEXP pBigMat_t) {

  XPtr<BigMatrix> xpMat(pBigMat);
  XPtr<BigMatrix> xpMat_t(pBigMat_t);
int NN(xpMat->ncol());
int MM(xpMat->nrow());

arma::Mat<double> aBigMat((double *)xpMat->matrix(), xpMat->nrow(), xpMat->ncol(), false);
arma::Mat<double> tBigMat(aBigMat.t());

MatrixAccessor<double> Am(*xpMat_t);

for (int i = 0; i < MM; i++){
std::memcpy(Am[i],tBigMat.colptr(i) , NN*sizeof(double));
}


  return TRUE;

}

回复:

library(Rcpp)
library(RcppArmadillo)
library(bigmemory)

Sys.setenv(PATH="%PATH%;C:/Rtools/gcc-4.6.3/bin;c:/Rtools/bin")

sourceCpp("big_T.cpp")
big_transpose<-function(bigm) {
            new_ptr<-big.matrix(nrow=ncol(bigm),ncol=nrow(bigm),type="double")
            BigArmaT(bigm@address ,new_ptr@address)
            return(new_ptr)
                        }

set.seed(4)
m <- matrix(rnorm(1000*2000), nrow=1000)
bigm <- as.big.matrix(m,type="double")


t_big<-big_transpose(bigm)
t_m<-t(as.matrix(bigm))
all.equal(t_m,as.matrix(t_big))

[1] 对

我发现我的尝试没有效率有两个原因:

  1. big.matrix我需要在 R 代码中创建第二个。有没有办法big.matrix 在 c++ 中创建指向新对象的外部指针?
  2. 为了工作memcpy,我必须创建一个循环。如何一次复制所有矩阵?
4

0 回答 0