0

问题

我正在使用该软件包[IRanges][1],并且需要为超过 2^31 约 10 倍的超长序列准确编码。

从下面,似乎IRanges使用int32

##### INSTALLATION FROM SRC CODE ######
## try http:// if https:// URLs are not supported
source("https://bioconductor.org/biocLite.R")
biocLite("IRanges")

##### CALL PACKAGE #####
require(IRanges)


IRanges(start=1,end=2^31-1) # Works fine

IRanges(start=1,end=2^31)   # Fail
Error in .Call2("solve_user_SEW0", start, end, width, PACKAGE = "IRanges") : 
  solving row 1: range cannot be determined from the supplied arguments (too many NAs)
In addition: Warning message:
In .normargSEW0(end, "end") : NAs introduced by coercion to integer range

由于此软件包通常用于 DNA 序列,因此能够处理大于 2^32 (≈ 10^9) 的值将非常有用,因为许多生物的基因组大小都比这更长。

问题

  • 我认为这是一个整数溢出问题是否正确?
  • 你遇到同样的问题吗?
  • 有没有办法解决这个问题?
    • 是否有可能(并且容易)找到源代码并只修改对象类型
    • 你认为这个包是否存在另一个版本?

我找到的唯一解决方案是接受降低我的准确度水平并将每个宽度除以 100 ......但我对降低我的准确度并不满意。

R版

R version 3.2.3 (2015-12-10) -- "Wooden Christmas-Tree"
Copyright (C) 2015 The R Foundation for Statistical Computing
Platform: x86_64-apple-darwin13.4.0 (64-bit)
4

1 回答 1

1

您正在达到可以用 R 表示的整数大小的限制。

> .Machine$integer.max
#[1] 2147483647
> log2(.Machine$integer.max)
#[1] 31

有一些特殊的库bit64可以gmp用来处理例如 64 位有符号整数。但是,不确定此类包表示的整数是否与其他库兼容。

于 2016-03-09T06:48:25.250 回答