由于更新了参考基因组,我必须从旧序列(来自床文件)中获取 fasta,以在最后一个版本中找到新坐标。
所以,从我的名为“my.fasta”的fasta文件中,(有35个序列)
我在此之后创建了一个“DNAStringSet”对象:
library ("GenomicRanges")
setwd("/pwd")
pwd <- "my.fasta" #INPUT FILES- BedFiles, FASTA, etc.
path <- system.file("pwd", package = "rGADEM")
FastaFile <- paste(pwd, path, sep = "")
Sequences <- readDNAStringSet(FastaFile, "fasta")
Sequences
A DNAStringSet instance of length 35
width seq names
[1] 300 TTCAGATTGGAGATGGTGAATGA...AACCCTCTGCATAGAATCATAG
[2] 300 GTCTCCCTTCGTGGAGGGGTCAC...TTAACTGAAGATGTTTCCCCGT
最后,我尝试使用 rGADEM 从我的 fasta 中提取坐标:
library("rGADEM")
gadem <- GADEM(Sequences, verbose = 1, genome = Ggallus)
startPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds
endPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds
巴德没有工作。如何从我的 fasta 文件中提取坐标?我需要一个 IRange、床或类似的东西。谢谢你。