问题标签 [protein-database]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
66 浏览

linux - 从 pdb trajctory 中提取每个文件

我有一个代表轨迹的 pdb 文件,该文件看起来像

我要打印信息

适用于所有型号。保留文件的格式。我试过这个

但是我的文件太大了,无法手动进行。我想将每个模型保存为模型 1、模型 2 等及其坐标信息,直到 ENDMDL

0 投票
2 回答
179 浏览

bioinformatics - 从蛋白质数据库中提取多个蛋白质序列以及二级结构

我想从任何蛋白质数据库中提取蛋白质序列及其相应的二级结构,比如 RCSB。我只需要短序列和它们的二级结构。就像是,

即使序列很长也没关系,但我希望在末尾有一个标签来表示它的二级结构。是否有任何编程工具或任何可用的东西。

正如我上面所展示的,我只想要这么少的信息。我怎样才能做到这一点?

0 投票
1 回答
63 浏览

cytoscape - How to get network into protein shape in cytoscape?

I have a protein network loaded into cytoscape. I want to get the network nodes into a shape that corresponds that of the protein shape/structure. This is so that I can superimpose the network image onto the protein structure image. I tried RINanalyzer and structureviz2, but it didn't help. Any solutions?

0 投票
1 回答
38 浏览

python - Biopython Array Addition Error (Open for all)

好的。让我先解释一下事情。我使用了Biopython此代码中命名的特定模块。如果您不习惯该模块,我将解释解决问题的必要细节。

代码是:

PDB 文件是蛋白质数据库文件。我正在使用的文件可以从https://drive.google.com/open?id=0B8oUhqYoEX6YVFJBTGlNZGNBdlk下载

如果您从第一个 for 循环中删除散列,您会发现它get_coord()返回一个(124,3)带有 dtype 的数组float32。同样,下一个 for 循环应该返回相同的值。

它给出了一个奇怪的错误:

我完全不知道它是如何创建一个248,3数组的。我只想在自身上添加数组坐标。我尝试对代码进行另一种修改:

它给出了同样的错误。你能帮我吗???

0 投票
3 回答
84 浏览

python - 使用python比较文件中不同行的两个单词

我正在处理来自蛋白质数据库的文件,它看起来像这样。

首先,我只需要提取标记为 ATOM 的行的第四列,这是特定原子所属的氨基酸序列。我在这里做过。

产生这个的输出

但我现在需要的是只输出第一个 ASP 和第一个 MET 等并将它们连接起来,这样它就会看起来像这样。

我在想也许我会尝试向前迭代一行并比较它,直到它与第一个输出不同,但我不确定我将如何做到这一点,如果您有任何其他想法或对我的代码有任何改进,请执行欢迎提出您的建议,谢谢。我还需要提一下,实际上一个文件中可能有两个相同的氨基酸,因此输出可能是“ASP MET ASP”

0 投票
2 回答
155 浏览

python - Bio.PDB mmcif2dict 模块不可调用

我使用来自 Bio.PDB 的函数 retrieve_pdb_file 获取了蛋白质的晶体结构。默认格式已从 PDB 更改为 PDBx/mmCif。我想从 cif 文件的标题中提取蛋白质序列。Bio.PDB 中应该有一个名为 MMCIF2Dict 的简单函数来执行此操作,但该模块不可调用。我还手动下载了 cif 文件并将其放在脚本文件夹中,但仍然是同样的错误。我的 biopython 是最新的。我做错了什么还是模块没有很好地实现?谢谢您的回答。

TypeError:“模块”对象不可调用

0 投票
2 回答
112 浏览

python - 这是什么意思?关于 Python 正则表达式

上次我的问题是,如何使用正则表达式获取方括号之间的内容?

我想获取括号之间的内容并制作名为 50267.fa 的新文件,如下所示

我得到了这样的答案,

当我尝试使用该代码时,它运行良好。但我不明白下面的代码是什么意思

0 投票
1 回答
203 浏览

perl - 从 BindingDB 下载 PDB 文件

我正在尝试找到一种使用 BindingDB 下载蛋白质 PDB 文件的方法。我有一个具有不同 BindingDB ID 的文件,我想为每个 ID 与蛋白质结合的每个配体下载 PDB 文件。

我正在使用脚本从 RSCB 下载特定的 PDB 文件:PDB。现在我必须这样做,但我有 BindingDB ID。

我之前使用的脚本如下所示:

0 投票
0 回答
156 浏览

bioinformatics - 如何仅对 TrEMBL 进行 BLAST

我正在使用 BioPython 进行命令行 BLAST。我需要搜索 TrEMBL,但我无法找到如何做到这一点。我知道我可以选择 db="nr",这很有效,但我只想搜索 TrEMBL,它构成 nr 序列的子集。另外,我需要能够在线进行,而不是远程进行!

编辑:如果有人遇到同样的问题:经过大量实验,我设法完成这项工作的唯一方法是下载 NCBI BLAST+ 并在独立准备好的库上进行远程搜索。如有疑问,请与我联系。

0 投票
1 回答
1367 浏览

python - 如何相对于参考框架移动蛋白质坐标

我有一个 PDB 文件 '1abz' ( https://files.rcsb.org/view/1ABZ.pdb ),其中包含蛋白质结构的坐标。请忽略标题注释的行,有趣的信息从第 276 行开始,它显示“模型 1”。

我想相对于原点的参考系(即 x=0,y=0,z=0)移动坐标并生成一个新的坐标文件。

我通读了 biopython 教程(http://biopython.org/wiki/The_Biopython_Structural_Bioinformatics_FAQ),使用了 Atom 对象的变换方法(http://biopython.org/DIST/docs/api/Bio.PDB.Atom.Atom- class.html#transform),并想出了这个脚本,但没有成功。

我该怎么办?提前谢谢了!