问题标签 [iranges]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

37 问题

0 投票

3 回答

79 浏览

r - 从开始到结束查找最接近的非重叠范围

我想找到从第一个开始到最后一个结束位置不重叠的最近范围。知道如何进行吗？在下面的示例中，应过滤掉 c(8, 33) 和 c(155, 161)，因为它们与前面的范围重叠。

r dplyr iranges

2020-09-07T07:57:19.480

0 投票

0 回答

29 浏览

merge - 基因组范围 - 在单个文件中合并重叠 (R STUDIO)

我想在文件中找到重叠的区域并将它们合并，以保持较早的开始和较晚的停止（将 2 个区域合并为 1）

我打算使用基因组范围，但我不确定如何编写脚本。

这是文件fileA.txt包含的内容：

脚本：

我不确定如何为单个文件设置查询和主题，以及作为文档的对象需要任何类型的“”或特定格式（bedGraph、txt 都可以吗？）以便在脚本中被识别？

非常感谢您的帮助！

K。

merge overlap overlapping genomicranges iranges

2021-03-03T09:35:15.987

0 投票

1 回答

38 浏览

r - R中的基因组坐标

我正在处理TxDb.Hsapiens.UCSC.hg19.knownGene数据。我发现最大外显子的长度是 205012。我怎样才能找到那个外显子的基因组坐标？

r bioinformatics genomicranges iranges

2021-03-14T18:06:07.253

0 投票

0 回答

52 浏览

r - TxDb.Hsapiens.UCSC.hg19.knownGene

我想知道 chr1 上 1Mb 区域的基因密度分布，正链和负链上的基因数量，以及正链和负链上有多少基因重叠。我正在使用 TxDb.Hsapiens.UCSC.hg19.knownGene。谢谢！

r bioinformatics bioconductor iranges

2021-03-14T19:57:38.673

0 投票

1 回答

17 浏览

r - 一种快速的方式 tp 传播线性范围

我有一个data.frame其中每一行都是线性间隔 - 特别是这些间隔是染色体上的开始和结束坐标（chr如下）：

染色体有两条链，因此有strand柱子。

我想将spread这些间隔设置为 1 的宽度，从而用一列替换start和列。到目前为止，我正在使用这个：endposition

但是对于我拥有的间隔数量和它们的大小来说，它有点慢。所以我的问题是是否有更快的选择。

r intervals spread genomicranges iranges

2021-04-26T20:40:40.867

0 投票

1 回答

47 浏览

r - 快速查找线性区间重叠的方法

我有一个data.frame线性区间（映射的 RNA-seq 读取的基因组坐标），例如：

对于某些读取，在同一读取的其他读取中包含或相交的间隔，我想合并它们。在上面的示例中read_id = "R10"，interval:chr5 12255229 12255312包含在 intervalchr5 12255142 12255535中。

对于单次读取data.frame，我使用以下过程：

这使：

因此merged.idx显示区间 6 和 7 indf1已合并。

我正在寻找一种在数千次读取中快速执行此操作的方法。显而易见的方法是do.call在唯一的读取中使用df：

但我想知道是否有更快的方法。请注意，实际上具有这种相交间隔的读取比例相对较小。

r merge intervals genomicranges iranges

2021-12-17T22:36:06.663

0 投票

1 回答

36 浏览

r - R：如何将基因范围缩小到单个载体中？

我通过基于行（“J3”、“J10”、“J11”、“J13”）对列进行子集来创建var_nt数据框。然后，我使用该函数将数据框转换为对象 ( )。tx_dfvariantvar_ntGRangesvarnt_grangemakeGRangesFromDataFrame

现在，我想编写一个 for 循环来将其折叠varnt_grange成一个向量。

我期待一个单一的基因范围向量，因为我得到了0 个范围。

输出

r dataframe bioinformatics bioconductor iranges

2022-02-19T21:42:21.160

1 2 3 4 5 6 7 8 9 10

问题标签 [iranges]

Reference