问题标签 [bioperl]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
228 浏览

perl - 有选择地将数组的元素连接到新数组的较少元素中

我在处理 .fasta 格式的 DNA 序列数据数组时遇到了一些麻烦。我特别想做的是获取一个包含几千个序列的文件,并将文件中每个序列的序列数据连接到文件中的一行。[Fasta 格式是这样的:序列 ID 以 > 开头,之后该行的所有内容都是描述。在下一行中,存在与此 ID 对应的序列。这可以无限期地持续到以 > 开头的下一行,这是文件中下一个序列的 id] 所以,在我的特定文件中,我的大部分序列都在多行上,所以我想做的基本上是删除换行符,但仅删除序列数据之间的新行,而不是序列数据和序列 ID 行(以 > 开头)之间的新行。

我这样做是因为我希望能够获得每个序列的序列长度(通过长度,我相信是最简单的方法),然后获得整个文件中所有序列的平均序列长度。

到目前为止,这是我的脚本,似乎不想工作:

程序部分的第二行foreach有问题,我似乎无法弄清楚它是什么。请注意,我什至还没有尝试过 END 行之后的代码,因为我似乎无法在过程步骤中获取代码来执行我想要的操作。知道如何获得一个包含完整序列元素的漂亮数组(我选择只从新数组中删除序列 ID 行..)吗?当我可以得到一个长度数组,然后我可以平均?

最后我很遗憾地承认我无法让 Bio::Perl 在我的计算机上工作,我已经尝试了几个小时,但这些错误超出了我的修复能力。我将与希望能帮助我解决 Bio::perl 问题的人交谈。但现在我只需要在没有它的情况下继续前进。

谢谢!抱歉这篇文章的长度,我很感激帮助。

安德鲁

0 投票
3 回答
151 浏览

perl - Perl:查找 _ 后跟 X,中间有东西

非常感谢您对早期问题的帮助。

我几乎完成了我正在做的最后一件事——特别是一个 ORF(开放阅读框)查找程序。到目前为止,我有一个名为@AminoAcidArray1 的数组。所有起始密码子都是“_”,所有终止密码子都是“X”。

如何计算 ORF?换句话说,当“_”后跟“X”且随机可忽略字符之间时,如何计算数组中的次数?我应该使用什么样的循环?我需要一个〜=我认为的某个地方

是的,我知道 bioPerl 可以轻松做到这一点,但由于某种原因,只有 activePerl 可用。

最诚挚的感谢, Shtanto

0 投票
1 回答
459 浏览

bioinformatics - Bioperl 读取 fasta 序列

我发现如果我的 fasta 文件以单行序列结尾,那么 Bioperl 返回的该序列将缺少一个核苷酸。如果 fasta 文件以新行结尾,则返回完整序列。不明白为什么?这是否要求 fasta 文件以空的新行结尾?

这是我正在使用的代码

和fasta序列:

gi|37423|emb|X04588.1| 用于细胞骨架原肌球蛋白 TM30(nm) 的人 2.5 kb mRNA CCCTTTAAATTTCCCTTTAAATTTCCCTTTAAATTTT

0 投票
4 回答
181 浏览

regex - Perl 仅从树中替换顶级数字

我是这个网站的新手。这是一个困扰我超过 2 小时的问题。我有一个字符串(newick 格式的系统发育树),它看起来像:

树可能有多个级别,用括号表示。现在我想在顶级数字(分支长度)中添加一个数字,比如 10。这里只有三个顶级数字:22、76、35。转换后的字符串应如下所示:

我已经尽力想出一个合适的正则表达式,但最终承认了我的局限性。怎样才能真正做到?

0 投票
2 回答
2245 浏览

perl - 如何安全卸载通过 CPAN 安装的 bioperl?

我通过 CPAN 安装了 BioPerl。几个测试失败了,我强行安装了它。我现在想通过 ubuntu 软件中心安装它。

谁能描述如何使用此处给出的方法删除通过 CPAN 安装的 BioPerl 。

0 投票
1 回答
518 浏览

perl - 在 Strawberry Perl 中安装 Bio::Restriction::Analysis

我正在尝试使用 CPAN 在 Strawberry Perl(v5.16.1.1 32 位)中安装模块 Bio::Restriction::Analysis。但是,看起来它不会通过一些测试。CPAN 的部分输出如下。

我正在 CPAN 中执行简单的“安装 Bio::Restriction::Analysis”,并接受所有默认安装选项。我曾认为 BioPerl 与 Strawberry Perl 捆绑在一起,所以这可能是问题之一。

0 投票
1 回答
89 浏览

bioperl - 使用 bioperl 从 GFF3 数据库中获取属性值

我已经使用 BioPerl 存储对象 (BIO:DB:SeqFeature:Store) 创建了一个 GFF3 DB 我自己从 Blastx 结果创建了 GFF3 文件,并创建了一系列我自己的标签作为属性。现在我将从 BioPerl 为我创建的数据库中获取这些值......

我该怎么做?

请帮忙!十分感谢。

0 投票
6 回答
7212 浏览

python - 计算原子坐标之间的距离

我有一个如下所示的文本文件

我想计算两个α碳原子之间的距离,即计算第一个和第二个原子之间的距离,然后计算第二个和第三个原子之间的距离,依此类推......两个原子之间的距离可以表示为:distance = sqrt((x1-x2)^2+(y1-y2)^2+(z1-z2)^2) .

第 7,8 和 9 列分别代表 x,y 和 z 坐标。我需要打印距离和相应的残差对(第 4 列),如下所示。(距离的值不是真实的)

如何使用 perl 或 python 进行此计算?

0 投票
2 回答
2468 浏览

perl - 使用带有非标准标题的 BioPerl 从 FASTA 文件中提取 DNA 序列

我正在尝试使用以下代码从数据库中提取序列:

我试图提取的序列的标题是:C7136661:0-107,如文件中所示:

当我将标题切换到更标准的东西(如test)时,代码工作正常。我认为 BioPerl 不喜欢非标准标题。有什么办法可以解决这个问题,这样我就不必重新编码 FASTA 文件了?

0 投票
2 回答
1357 浏览

r - 序列比对

我想对 uniprot 和 pdb 序列进行成对对齐。我有一个包含这样的 uniprot 和 pdb ID 的输入文件。

首先,我需要读取输入文件中的每一行 2) 从 pdb.fasta 和 uniprot.fasta 文件中检索 pdb 和 uniprot 序列 3) 进行对齐并计算序列同一性。

通常,我使用以下程序进行成对对齐和 seq.identity 计算。

我需要像这样打印输出

如何更改上述代码?您的帮助将不胜感激!

'