2

我正在使用 Rcpp 将 C++ 程序包装在 R 包中。我的 C++ 程序需要以下标头:

#include "htslib/sam.h"

在编译之前,我通常在 Ubuntu 中加载以下模块:

HTSlib/1.11-GCC-9.3.0

我通常使用 GCC/9.3.0 在 Ubuntu 中使用以下标志编译 C++ 脚本:

g++ scriptname.cpp -Ihtslib -Lhtslib -lhts

由于我是通过 Rcpp 从 R 访问程序,所以我不知道如何加载 HTSlib 模块。当我尝试“清理并重建”包时,我收到以下错误:

fatal error: htslib/sam.h: No such file or directory
    #include "htslib/sam.h"
                           ^
   compilation terminated.

我有两个问题:

  1. 从 C++ 源代码构建 R 包时如何加载 C++ 模块?

  2. 从 C++ 源代码构建 R 包时如何包含编译标志?

我创建了一个最小的头文件、.R 文件和 C++ 源脚本。该脚本打开一个 bam 文件并输出读取的染色体名称和位置。这些文件并不代表我想要运行的实际程序(这里包含的程序太长太复杂),但是当我尝试使用 Rcpp 构建包时会产生相同的错误。

C++源文件:

#include "htslib/sam.h"
#include <string>
#include <iostream>
#include <stdio.h>
#include <string.h>
#include <Rcpp.h>
#include "HTSlibBasics.h

void OpenBam(std::string command_string){
    // Stores filename and converts to character string
    const char * char_command;
    char_command = command_string.c_str();
    
    // Opens bam file
    samFile *fp = sam_open(char_command, "r");
    
    // Opens bam header
    bam_hdr_t *h = sam_hdr_read(fp);
    
    // Initialize an alignment
    bam1_t *b = bam_init1();
    
    while(sam_read1(fp, h, b) >= 0) {
        if (b->core.tid < 0){
            continue;
        }else{
            std::cout << h->target_name[b->core.tid] << "\t" << b->core.pos << "\t" << bam_endpos(b) << std::endl;
       }
    }
    
    /*
    * Destroy the alignment and header which have been read into the C++ program
    * and close the sam file.
    */
    bam_destroy1(b);
    bam_hdr_destroy(h);
    sam_close(fp);
}

头文件:

#ifndef OPEN_BAM
#define OPEN_BAM

//' Documentation
//' @param command_string Documentation
// [[Rcpp::export]]
void OpenBam(std::string command_string);

#endif // OPEN_BAM

R文件:

## usethis namespace: start
#' @useDynLib HTSlibBasics, .registration = TRUE
## usethis namespace: end
NULL
## usethis namespace: start
#' @importFrom Rcpp sourceCpp
## usethis namespace: end
NULL
#' Documentation
#' @export
OpenBam <- function(command_string) {
  .Call(`_HTSlibBasics_OpenBam`, command_string)
}

R 文件位于包的“R”目录中,而 C++ 脚本和头文件位于“src”目录中。

4

1 回答 1

1

我想通了:原来答案很简单。我松散地遵循了 Dirk Eddelbuettel 的小插图 ( https://cloud.r-project.org/web/packages/Rcpp/vignettes/Rcpp-libraries.pdf ),还结合了来自网络的一大堆信息。

在命令行中,我导航到系统上的 HTSlib 目录:

cd /sw/eb/sw/HTSlib/1.11-GCC-9.3.0/

接下来,我导航到包含 htslib 头文件的目录并将它们移动到我的 R 包的 src/ 目录:

cd include/htslib
cp *.h /home/annabelperry/R/HTSlibBasics/src/

然后,我导航到我的 C++ 源文件并将标题更改include "htslib/sam.h"include "sam.h",因为我的 sam.h 文件不再位于 htslib 目录中。

然后我导航到 HTSlib 库目录并将每个文件复制到我的 R 包外的目录中。(注意:我尝试复制整个目录并移动它,但这导致了编辑访问问题)。

cd /sw/eb/sw/HTSlib/1.11-GCC-9.3.0/lib
cp libhts.a /home/annabelperry/R/lib/
cp libhts.so /home/annabelperry/R/lib/
cp libhts.so.1.11 /home/annabelperry/R/lib/
cp libhts.so.3 /home/annabelperry/R/lib/
cd pkgconfig
cp htslib.pc /home/annabelperry/R/lib/pkgconfig/

Makevars然后,我在 src/ 目录中为我的 R 包创建了一个文件,并输入了以下内容:

CXX_STD = CXX11
PKG_CXXFLAGS = -Ihtslib
PKG_LIBS = -L/home/annabelperry/R/lib -lhts -Wl,-rpath,/home/annabelperry/R/lib

-L链接器标志提供查找库文件的目录,链接-l器标志提供库文件的基本名称。

当我尝试构建包时,我收到一条错误消息,libcrypto.so.10提示找不到库。我将此库从其原始目录 , 移动/usr/lib64/home/annabelperry/R/lib/包含其余库文件的目录。

我还必须std::cout从我的源代码中删除所有调用,因为它们与 Rcpp 不兼容。

在此之后,我可以成功构建包。

于 2021-07-03T22:53:43.017 回答