问题标签 [bioperl]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
319 浏览

perl - 将序列导出为 fasta 宽格式

我正在尝试使用Bio::SeqIO. 结果是序列每 60 列被一个新行打破。我该如何避免呢?
我希望以“宽”格式导出序列,即序列中没有换行符。

我的代码大致是:

0 投票
1 回答
298 浏览

perl - 尝试在 BioPerl 中对系统发育树进行自定义排序会导致“未定义值”或“未授权参考”错误

我在 BioPerl 中加载了一个系统发育树。我想在打印出树时使用自定义排序函数(下面的“$depth_sort”)对节点进行垂直排序。然而,下面使用的记录方法以读取树的相同顺序写出树,而没有实际排序:

相反,我可以手动遍历树以查看发生了什么。如果我在本地进行自己的排序,它会按预期工作:

但是,如果我将自定义排序传递给 each_Descendent(上面的 write 调用应该采用的方式):

然后它随着消息而死:

无法在 treeFlipper.pl 第 7 行第 1 行的未定义值上调用方法“深度”。

我在这里找到了另一个我认为让我走上正轨的线程,但我还没有解决它:Perl 排序;干净地处理跨命名空间的 $a、$b 包全局变量

在第一个答案中切换到原型方法:

给我:

无法在 treeFlipper.pl 第 9 行第 1 行的 unblessed 引用上调用方法“深度”。

但是,如果我检查 ref 类型,那似乎是正确的:

当我尝试强制祝福参考时(这可能是一件可怕的事情):

我得到:

不是 /usr/local/share/perl/5.14.2/Bio/Tree/Node.pm 第 433 行第 1 行的 HASH 引用。

该线程中的其他方法(使用调用者)给了我同样的旧“未定义值”错误。

这是 BioPerl 的问题,还是(我怀疑)我仍然遗漏了什么?谢谢!

编辑:在 Ubuntu 12.04 LTS 上使用 Perl 5.14.2

0 投票
2 回答
2523 浏览

perl - 我想用另一个名称替换 fasta 文件中的序列名称

我有一个fasta文件和一个文本文件fasta文件包含fasta格式的序列,文本文件包含基因名称现在我想用文本文件中的基因名称替换fasta文件中“>”符号后的序列名称我是新来的perl 虽然我已经写了一个脚本,但我不知道为什么它不工作任何人都可以帮助我请以下是我的脚本:

我的文件如下所示:

注释.txt

pool75_contig_389 泛素连接酶 e3a
pool75_contig_704 肿瘤易感性
pool75_contig_1977 丝氨酸苏氨酸蛋白磷酸酶 4 催化亚基
pool75_contig_3064 bardet-biedl 综合征 2 蛋白 P
pool75_contig_2499 琥珀酰连接酶

goat300.fasta

0 投票
2 回答
310 浏览

perl - 使用 perl 下载序列文件

我正在尝试使用 perl 从基因库数据库下载序列文件,但它显示错误。我没有任何指南来纠正我的程序。

谁能帮我这个?错误在第 6 行 ( use Bio::DB::GenBank;)

文件 accnumber.txt 在我的桌面上,我正在从桌面本身运行程序。我正在使用 CentOS。

这些是我得到的错误:

0 投票
1 回答
329 浏览

perl - Bioperl 和 Samtools

如何使用 Bioperl 运行“mpileup”?

尝试使用 Bio::Tools::Run::Samtools 运行 mpileup 时,我得到 'mpileup' 未注册。我究竟做错了什么?任何指向正确方向的指针表示赞赏......谢谢你们......

0 投票
1 回答
506 浏览

perl - Perl how to catch two exceptions thrown at once

I am parsing a large EMBL file (>1G) and convert it to a gff file. It has some entries are not matching the traditional embl formation thus cause the bioperl module to throw exceptions. My question is since entries with error are only small portion of total sequences and I want to continue the script and just ignore the exception for now. But the perl script was always stoped by exceptions.

I am under a linux OS and with perl version 5.8.8

my perl script

The error I got

NOTE: I didn't post the exception twice, it just happen this way and only one exception seems to be caught .

Here is the block of embl file cause the problem. The mRNA entry causes the first exception and the CDS causes the second.

0 投票
1 回答
6309 浏览

perl - 如何运行“构建 installdeps”来安装缺少的先决条件

尝试运行 Build.PL 文件并获得以下错误消息:

但是当我运行时:

我得到:

有人知道我在这里做错了什么吗?

0 投票
1 回答
683 浏览

perl - Build.PL 不会在 git repo 中运行

我正在尝试运行 bioperl-live 包,并且我已经 git 克隆了以下 repo

并 cd 到 bio-perl live 的安装位置。然后我尝试运行:

我回来了:

所以我打开了一个 cpan shell,当我从 cpan 运行时:

并重复构建我得到同样的错误。有人介意克隆上面的 git repo(如果你想检查自己,可以在https://github.com/bioperl/bioperl-live找到),如果你遇到同样的问题,请告诉我。

请注意,其他包中的其他 Build.PL 文件不会发生这种情况 - 它运行良好。那个 git repo 中一定有一些损坏/丢失的东西。

谢谢

更新 - 当我运行 perl -wle 'use Test::Most'

我得到:

无法在 @INC 中找到 Test/Most.pm(@INC 包含:/home/arron/src/bioperl-live /etc/perl /usr/local/lib/perl/5.12.4 /usr/local/share/ perl/5.12.4 /usr/lib/perl5 /usr/share/perl5 /usr/lib/perl/5.12 /usr/share/perl/5.12 /usr/local/lib/site_perl .) at -e line 1. BEGIN failed——编译在 -e line 1 处中止。enter code here

还将 cpan 配置为以 root 身份安装,然后安装 Test::Most 没有区别。这么大惊小怪!

0 投票
1 回答
489 浏览

perl - BioPerl 模块 Bio::DB::EntrezGene 不再工作

我一直在使用Bio::DB::EntrezGene模块 fromBioPerl来检索给定数字 ID 的 Entrez 基因名称。

这工作了几个月,最近就在两周前。不过,最近它只返回一个错误。

(对我来说)最奇怪的是,即使我只是运行文档中的示例代码,也会发生这种情况。例如,如果我运行这个:

我明白了:

如果有人对可能发生的事情以及如何解决它有任何想法,将不胜感激。谢谢!

0 投票
2 回答
965 浏览

python - 在基因组中搜索具有错配的序列

我有一个 fastq 文件,其中包含超过 1 亿次读取和 10000 长的基因组序列

我想从 fastq 文件中取出序列并在允许 3 个不匹配的情况下在基因组序列中搜索

我尝试使用 awk 以这种方式从 fastq 文件中获取序列:

1.fq(几行)

@DH1DQQN1:269:C1UKCACXX:1:1101:1207:2171 1:N:0:TTAGGC NATCCCCATCCTCTGCTTGCTTTTCGGGATATGTTGTAGGATTCTCAGC

+

1=ADBDDHD;F>GF@FFEFGGGIAEEI?D9DDHHIGAAF:BG39?BB

@DH1DQQN1:269:C1UKCACXX:1:1101:1095:2217 1:N:0:TTAGGC TAGGATTTCAAATGGGTCGAGGTGGTCCGTTAGGTATAGGGGCAACAGG

+

??AABDD4C:DDDI+C:C3@:C):1?*):?)?################

$ awk 'NR%4==2' 1.fq

NATCCCCATCCTCTGCTTGCTTTTCGGGATATGTTGTAGGATTCTCAGC TAGGATTTCAAATGGGTCGAGGTGGTCCGTTAGGTATAGGGGCAACAGG

我有文件中的所有序列,现在我想获取每一行序列并在允许 3 个不匹配的情况下在基因组序列中搜索,如果找到则打印序列

例子:

基因组序列文件:

GGGGAGGAATATGATTTACAGTTTATTTTTCAACTGTGCAAAATAACCTTAACTGCAGACGTTATGACATACATACATTCTATGAATTCCACTATTTTGGAGGACTGGAATTTTGGTCTACAACCTCCCCCAGGAGGCACACTAGAAGATACTTATAGGTTGTAACCCAGGCAATTGCTTGTCAAAAACATACA

搜索序列文件:

GGGGAGGAATATGAT

GGGGAGGAATATGAA

GGGGAGGAATGCC

TCAAAAACATAGG

TCAAAAACATGGG

输出文件:

GGGGAGGAATATGAT 0#0错配精确序列

GGGGAGGAATATGAA 1 # 1 不匹配

GGGGAGGAATATGCC 2 #2 不匹配

TCAAAAACATAGG 2 # 2 不匹配

TCAAAAACATGGG 3 # 3 不匹配