问题标签 [iranges]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 从开始到结束查找最接近的非重叠范围
我想找到从第一个开始到最后一个结束位置不重叠的最近范围。知道如何进行吗?在下面的示例中,应过滤掉 c(8, 33) 和 c(155, 161),因为它们与前面的范围重叠。
merge - 基因组范围 - 在单个文件中合并重叠 (R STUDIO)
我想在文件中找到重叠的区域并将它们合并,以保持较早的开始和较晚的停止(将 2 个区域合并为 1)
我打算使用基因组范围,但我不确定如何编写脚本。
这是文件fileA.txt包含的内容:
脚本:
我不确定如何为单个文件设置查询和主题,以及作为文档的对象需要任何类型的“”或特定格式(bedGraph、txt 都可以吗?)以便在脚本中被识别?
非常感谢您的帮助!
K。
r - R中的基因组坐标
我正在处理TxDb.Hsapiens.UCSC.hg19.knownGene
数据。我发现最大外显子的长度是 205012。我怎样才能找到那个外显子的基因组坐标?
r - TxDb.Hsapiens.UCSC.hg19.knownGene
我想知道 chr1 上 1Mb 区域的基因密度分布,正链和负链上的基因数量,以及正链和负链上有多少基因重叠。我正在使用 TxDb.Hsapiens.UCSC.hg19.knownGene。谢谢!
r - 一种快速的方式 tp 传播线性范围
我有一个data.frame
其中每一行都是线性间隔 - 特别是这些间隔是染色体上的开始和结束坐标(chr
如下):
染色体有两条链,因此有strand
柱子。
我想将spread
这些间隔设置为 1 的宽度,从而用一列替换start
和列。到目前为止,我正在使用这个:end
position
但是对于我拥有的间隔数量和它们的大小来说,它有点慢。所以我的问题是是否有更快的选择。
r - 快速查找线性区间重叠的方法
我有一个data.frame
线性区间(映射的 RNA-seq 读取的基因组坐标),例如:
对于某些读取,在同一读取的其他读取中包含或相交的间隔,我想合并它们。在上面的示例中read_id = "R10"
,interval:chr5 12255229 12255312
包含在 intervalchr5 12255142 12255535
中。
对于单次读取data.frame
,我使用以下过程:
这使:
因此merged.idx
显示区间 6 和 7 indf1
已合并。
我正在寻找一种在数千次读取中快速执行此操作的方法。显而易见的方法是do.call
在唯一的读取中使用df
:
但我想知道是否有更快的方法。请注意,实际上具有这种相交间隔的读取比例相对较小。
r - R:如何将基因范围缩小到单个载体中?
我通过基于行(“J3”、“J10”、“J11”、“J13”)对列进行子集来创建var_nt
数据框。然后,我使用该函数将数据框转换为对象 ( )。tx_df
variant
var_nt
GRanges
varnt_grange
makeGRangesFromDataFrame
现在,我想编写一个 for 循环来将其折叠varnt_grange
成一个向量。
我期待一个单一的基因范围向量,因为我得到了0 个范围。
输出