13

我想复制以下 R 函数Rcpp

fR = function(x) x[1:2]

fR(c(1,2,3))
#[1] 1 2
fR(c('a','b','c'))
#[1] "a" "b"

我可以对固定输出类型执行此操作,如下所示:

library(inline)
library(Rcpp)

fint = cxxfunction(signature(x = "SEXP"), '
          List xin(x);
          IntegerVector xout;

          for (int i = 0; i < 2; ++i) xout.push_back(xin[i]);

          return xout;', plugin = "Rcpp")

但这仅适用于整数,如果我尝试将xout类型替换为List(或GenericVector,它们是相同的) - 它适用于任何输入类型,但我得到的是 alist而不是向量。

这样做的正确Rcpp方法是什么?

4

2 回答 2

12

不要push_backRcpp类型上使用。目前实现 Rcpp 向量的方式需要每次都复制所有数据。这是一个非常昂贵的操作。

我们有RCPP_RETURN_VECTOR用于调度,这需要您编写一个模板函数,将 Vector 作为输入。

#include <Rcpp.h>
using namespace Rcpp ;

template <int RTYPE>
Vector<RTYPE> first_two_impl( Vector<RTYPE> xin){
    Vector<RTYPE> xout(2) ;
    for( int i=0; i<2; i++ ){
        xout[i] = xin[i] ;    
    }
    return xout ;
}

// [[Rcpp::export]]
SEXP first_two( SEXP xin ){
  RCPP_RETURN_VECTOR(first_two_impl, xin) ;
}

/*** R
    first_two( 1:3 )
    first_two( letters )
*/

只需sourceCpp这个文件,这也将运行调用这两个函数的 R 代码。实际上,模板可以更简单,这也可以:

template <typename T>
T first_two_impl( T xin){
    T xout(2) ;
    for( int i=0; i<2; i++ ){
        xout[i] = xin[i] ;    
    }
    return xout ;
}

模板参数T只需要:

  • 构造函数采用int
  • 一个operator[](int)

或者,这可能是dplyr矢量访问者的工作。

#include <dplyr.h>
// [[Rcpp::depends(dplyr,BH)]]

using namespace dplyr ;
using namespace Rcpp ;

// [[Rcpp::export]]
SEXP first_two( SEXP data ){
    VectorVisitor* v = visitor(data) ;
    IntegerVector idx = seq( 0, 1 ) ;
    Shield<SEXP> out( v->subset(idx) ) ;
    delete v ;
    return out ;
}

访问者让您可以在向量上执行一系列操作,而不管它包含的数据类型如何。

> first_two(letters)
[1] "a" "b"

> first_two(1:10)
[1] 1 2

> first_two(rnorm(10))
[1] 0.4647190 0.9790888
于 2013-11-07T06:33:04.443 回答
0

您需要选择一种类型(即不要使用signature="SEXP"[ 哦,无论如何您都应该查看 Attributes ])。

或者你保留SEXP类型,并在内部调度。例如,请参阅Rcpp Gallery 上的这篇文章

编辑: C当然是静态类型的。这些取决于类型的开关也遍布 R 源。这里没有免费的午餐。

于 2013-11-06T22:23:34.033 回答