问题标签 [bioperl]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
257 浏览

algorithm - Bioperl 程序执行错误

我已经安装了 bioperl,但对在哪里获取它以及在哪里运行 bioperl 程序感到困惑。然后我对其进行了测试,它成功了我已经为多个 seq 运行了一个程序。结盟。

产生了错误

无法在 @INC 中找到 Bio/Tools/Run/Alignment/Clustalw.pm(@INC 包含:/etc/perl /usr/local/lib/perl/5.14.2 /usr/local/share/perl/5.14. 2 /usr/lib/perl5 /usr/share/perl5 /usr/lib/perl/5.14 /usr/share/perl/5.14 /usr/local/lib/site_perl .) 在 msa.pl 第 3 行。开始失败--编译在 msa.pl 第 3 行中止。

0 投票
2 回答
480 浏览

perl - 使用 BioPerl 打印 FASTA 文件的序列

我有这个代码

期望以这种方式打印序列seq_id TAB sequence。但是,此代码打印一个空文件。你知道发生了什么事吗?

0 投票
2 回答
167 浏览

string - 捕获输出以流式传输并存储为字符串变量

尽管这个问题与“BioPerl”有关,但我相信这个问题可能比这更笼统。

基本上我已经生成了一个Bio::Tree::TreeI对象,我正在尝试将其转换为字符串变量。

我可以接近将其转换为字符串变量的唯一方法是使用以下命令将该树写入流:

->write_tree 的输出是“将树写入流”,但是我如何在字符串变量中捕获它,因为我找不到从Bio::TreeIO中的任何函数返回字符串的另一种方法

0 投票
2 回答
242 浏览

python - 解析 MEDLINE 文件以进行 GWAS 挖掘

我正在尝试将0,1MedLine 文件解析为表格以执行一些统计下游分析:PCA、GWAS 等。我使用名为Bio.Medline的 Python 模块和一些额外的 shell 命令对其进行了格式化。现在,我不知道如何继续。

我需要将File 1, - 每行一张纸和制表符分隔的关键字的键值文件 - 转换为具有折叠关键字和关键字的存在/不存在显示为 1 或 0 值的文件。

我想用 Perl 做到这一点,但欢迎使用其他解决方案。

谢谢,贝尔纳多

File 1

期望的输出:

0 投票
1 回答
111 浏览

perl - Perl Biomart 超时错误

我正在使用 Biomart Perl API 从网络服务器下载数据。有时我会收到错误消息:Web 服务器问题:500 读取超时。是否有可能以某种方式捕获此错误并尝试再次下载文件?

0 投票
4 回答
6943 浏览

perl - 安装 Bio::DB::Sam perl 模块

我正在尝试Bio::DB::Sam在远程服务器上的主目录上安装 perl 模块。

我下载了模块,提取了文件,然后运行:

这就是接下来会发生的事情:

接下来当我尝试运行时:

这就是我得到的:

我确实谷歌了可能的解决方案并尝试了几个,但他们没有工作,例如--enable-shared OR export CXXFLAGS="$CXXFLAGS -fPIC"

我已经在我的主目录中安装了 Bioperl。

任何帮助,将不胜感激。

干杯

0 投票
1 回答
411 浏览

perl - 使用 PERL 将信息从 .gtf 提取到新的文本文件

我有下面的 .gtf 文件,我只需要提取 4 个变量(染色体、开始/停止密码子和转录本 id

我的问题是脚本如何知道在选定的文件上工作?

你用过:

(1)my $file = 'transcripts_selected.gtf'

(2) 这个脚本也可以用来提取切片数据:

或应该:

BioSeq->new(-chromosome_number, -start_codon...)使用方法?

(3) 最后,这个脚本取自 BioperlHOWTO:

  • 哪里说变量 $infile/$outfile 应该把 .gtf 文件的名称放在这里,用所选数据的新文件的名称替换 $outfile?
0 投票
0 回答
110 浏览

bioperl - BioPerl: Annotate mismatches in an alignment

I'm reasonably new to perl and very new to BioPerl, so my apologies if this seems like a trivial question. I'm using Bio::AlignIO and Bio::SimpleAlign to generate pairwise alignments of sequences of interest to a reference sequence - in this case the human mtDNA reference sequence. I'm able to generate the alignment in fasta format without issue, however I wish to record the differences between the reference and the sequences of interest in a tab delimited file for use with the webtool Haplogrep (http://haplogrep.uibk.ac.at/index.html). I can imagine doing this as loop whereby I go through each base of the reference sequence and say if the position in the reference does not match the query sequence, record the position and the nucleotide present in the query sequence. However, I can't figure out how to do this from the Bio::AlignIO object generated as part of the alignment. Here is the code I have so far:

So to give a brief example, if I had generated an alignment such as this one:

would then like to generate an output such as:

Can anyone help me figure out how to do so? General comments on better/easier ways to do this are also greatly appreciated.

0 投票
1 回答
206 浏览

bioperl - BioPerl:提取 CDS 错误

我正在尝试使用 BioPerl 从 GenBank 文件中提取 CDS 和相应的氨基酸序列。脚本如下所示:

}

我收到错误消息:Filehandle GEN1 opens only for input at /Library/Perl/5.12/Bio/Root/IO.pm line 533, line 148。

请帮我解决这个问题。

提前致谢

0 投票
1 回答
1500 浏览

perl - 从 .gff 中提取基因 ID + 功能注释

我有一个看起来像这样的 .gff 文件:

……

我需要属于它们的基因 ID 和功能注释。我想在 R 中使用它。

gffread看来我只能提取序列。

输出应如下所示:

Gene-ID \t functionannotation

NbS00000988g001 \t MYB transcription factor [Solanum lycopersicum]

bioperl 中是否有任何工具或迷你脚本?