问题标签 [iranges]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
79 浏览

r - 从开始到结束查找最接近的非重叠范围

我想找到从第一个开始到最后一个结束位置不重叠的最近范围。知道如何进行吗?在下面的示例中,应过滤掉 c(8, 33) 和 c(155, 161),因为它们与前面的范围重叠。

0 投票
0 回答
29 浏览

merge - 基因组范围 - 在单个文件中合并重叠 (R STUDIO)

我想在文件中找到重叠的区域并将它们合并,以保持较早的开始和较晚的停止(将 2 个区域合并为 1)

我打算使用基因组范围,但我不确定如何编写脚本。

这是文件fileA.txt包含的内容:

脚本:

我不确定如何为单个文件设置查询和主题,以及作为文档的对象需要任何类型的“”或特定格式(bedGraph、txt 都可以吗?)以便在脚本中被识别?

非常感谢您的帮助!

K。

0 投票
1 回答
38 浏览

r - R中的基因组坐标

我正在处理TxDb.Hsapiens.UCSC.hg19.knownGene数据。我发现最大外显子的长度是 205012。我怎样才能找到那个外显子的基因组坐标?

0 投票
0 回答
52 浏览

r - TxDb.Hsapiens.UCSC.hg19.knownGene

我想知道 chr1 上 1Mb 区域的基因密度分布,正链和负链上的基因数量,以及正链和负链上有多少基因重叠。我正在使用 TxDb.Hsapiens.UCSC.hg19.knownGene。谢谢!

0 投票
1 回答
17 浏览

r - 一种快速的方式 tp 传播线性范围

我有一个data.frame其中每一行都是线性间隔 - 特别是这些间隔是染色体上的开始和结束坐标(chr如下):

染色体有两条链,因此有strand柱子。

我想将spread这些间隔设置为 1 的宽度,从而用一列替换start和列。到目前为止,我正在使用这个:endposition

但是对于我拥有的间隔数量和它们的大小来说,它有点慢。所以我的问题是是否有更快的选择。

0 投票
1 回答
47 浏览

r - 快速查找线性区间重叠的方法

我有一个data.frame线性区间(映射的 RNA-seq 读取的基因组坐标),例如:

对于某些读取,在同一读取的其他读取中包含或相交的间隔,我想合并它们。在上面的示例中read_id = "R10",interval:chr5 12255229 12255312包含在 intervalchr5 12255142 12255535中。

对于单次读取data.frame,我使用以下过程:

这使:

因此merged.idx显示区间 6 和 7 indf1已合并。

我正在寻找一种在数千次读取中快速执行此操作的方法。显而易见的方法是do.call在唯一的读取中使用df

但我想知道是否有更快的方法。请注意,实际上具有这种相交间隔的读取比例相对较小。

0 投票
1 回答
36 浏览

r - R:如何将基因范围缩小到单个载体中?

我通过基于行(“J3”、“J10”、“J11”、“J13”)对列进行子集来创建var_nt数据框。然后,我使用该函数将数据框转换为对象 ( )。tx_dfvariantvar_ntGRangesvarnt_grangemakeGRangesFromDataFrame

现在,我想编写一个 for 循环来将其折叠varnt_grange成一个向量。

我期待一个单一的基因范围向量,因为我得到了0 个范围

输出