问题标签 [genomicranges]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何按染色体订购 Granges 对象?
我有一个 GRanges 对象,其中包含关于 chr1:22、chrX 和 chrY 的数据。目前,该seqnames
列按以下方式排序:1, 10, 11, 12,..., 19, 2, 20, 21, 22, 3, 4,..., X, Y
. 我想绘制我的数据,但无法找到重新排序数据框的方法,以便将行排序为1, 2, 3, 4,..., X, Y
. 关于我如何做到这一点的任何建议?
r - 使用 ggbio 和 geom_alignment 为基因或片段添加标签
我正在尝试使用 ggbio 包中的 geom_alignment 来绘制一段基因,并且我想在每个基因下显示标签。geom_alignment 的文档说这是通过指定 label = TRUE 并在 names.expr 中提供标签向量来完成的。问题是它似乎不起作用,并且它没有抛出任何可能包含线索的错误消息。
所以它完全按照预期绘制了段,但没有标注。我在这里错过了什么吗?
有一个与此类似的较早问题: Adding Labels to Individual Genes with ggbio and ggplot2
那里建议的答案涉及在绘图之前将 Granges 对象拆分到 group 变量上,但是我需要将 Granges 对象的各个部分保持在一起,无论如何,这个修复似乎没有按建议工作。
这是我的会话信息:
r - 如何将一个GRanges对象查询成可以再次查询的对象?
“我加载了一个从 Gencode 创建的 TxDb 对象并查询它的外显子,然后我使用 lapply 从每个具有 >1 外显子的转录本中获取所有 LAST 外显子:
接下来,我想对这些范围执行操作。如shift()
或任何其他。但是我收到警告:
(函数(类,fdef,mtable)中的错误:无法找到签名“列表”的函数“调整大小”的继承方法</p>
我的问题是,我怎样才能让这个对象恢复为可以使用 Granges 函数操作的格式?
或者,我怎样才能以一种避免这个问题的方式获得每个转录本的最终外显子?
r - 快速查找线性区间重叠的方法
我有一个data.frame
线性区间(映射的 RNA-seq 读取的基因组坐标),例如:
对于某些读取,在同一读取的其他读取中包含或相交的间隔,我想合并它们。在上面的示例中read_id = "R10"
,interval:chr5 12255229 12255312
包含在 intervalchr5 12255142 12255535
中。
对于单次读取data.frame
,我使用以下过程:
这使:
因此merged.idx
显示区间 6 和 7 indf1
已合并。
我正在寻找一种在数千次读取中快速执行此操作的方法。显而易见的方法是do.call
在唯一的读取中使用df
:
但我想知道是否有更快的方法。请注意,实际上具有这种相交间隔的读取比例相对较小。
r - 如何从两个数据表中删除重叠序列?
我有两个 data.tables 提供跨不同染色体(类别)的序列坐标。例如:
我需要创建第三个 data.table,它为包含 dt1 中的所有整数的序列提供坐标,这些整数不与 dt2 中的序列中的任何整数重叠。例如:
我需要运行它的 data.tables 非常大,因此我需要最大限度地提高性能。我曾尝试使用 foverlaps() 函数,但无济于事。任何帮助将不胜感激!
r - R:For循环按列表对Granges对象进行子集
我有一个txf_df
子集gene.list$entrez
,然后找到唯一数量的成绩单列表。然后txf_df
转换为txf_grange
.
现在,我想创建一个包含 15 个unique
基因的 for 循环,在每次迭代时,txf_grange
仅按特定基因对对象进行子集化。
代码:
数据: