问题标签 [protein-database]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何从 pdb 文件中分别获取 X、Y 或 Z 坐标
我有一个 PDB 文件 '1abz' ( https://files.rcsb.org/view/1ABZ.pdb ),其中包含蛋白质结构的坐标。请忽略标题注释的行,有趣的信息从第 276 行开始,它显示“模型 1”。
我想从 pdb 文件中分别获取 X、Y 或 Z 坐标。
此链接解释了 pdb 文件的列号:http: //cupnet.net/pdb-format/
这是我拥有的代码,但我收到一条错误消息。
python - 在 Eclipse 中将 PyMol 模块导入 python 程序
嗨,我是 Python 和 PyMol 的完整初学者,但我在 Java 方面做了很多工作。我正在尝试将 pymol 模块(我认为它们称为模块或库)导入到我在 Eclipse 中的 python 程序中,但我不断收到错误“没有名为‘pymol’的模块”。是否需要添加一些代码来导入 pymol 或者我是否需要更改一些路径变量或其他东西......我想确保这段代码也可以在其他计算机上运行,所以希望我的问题的解决方案只是额外的代码,而不是进入我的系统并更改变量或路径。
linux - 如何删除与另一个文件中的元素匹配的行
我正在学习 Perl,我正在尝试弄清楚如何完成这项任务。我有一个包含一堆文本文件的文件夹,我有一个ions_solvents_cofactors
包含三个字母列表的文件。
我编写了一个脚本,该脚本打开并读取文件夹中的每个文件,并应删除特定列 [3] 下与列表中的某些元素匹配的那些行。它工作不正常。我在脚本末尾遇到了一些问题,无法弄清楚它是什么。
我得到的错误是:rm: invalid option -- '5'
我的输入文件如下所示:
这是脚本:
因此,例如,如果308
从输入文件中匹配文件 ions_cofactors_solvents`,则删除所有匹配的行。
awk - 如何将文件特定列的值粘贴到另一个命令中?
我想用fastacmd
来提取 fasta 序列的特定区域。为此,我需要输入 fasta 文件-d
的名称、序列的名称-s
和要提取的序列的位置-L
。例如:
fastacmd -d OAP11402.1.fa -s OAP11402.1 -L 50,100
但问题是我有数百个文件(每个文件都有一个与文件同名的序列),并且要提取的每个序列的位置信息都在蛋白质数据库中(info_sequences.txt
)。所以,我想做一个循环来粘贴文件的名称,序列和从蛋白质数据库info_sequences.txt
中 提取的位置fastacmd
。
的样子info_sequences.txt
是这样的:
我认为这awk
可能会有所帮助,但我正在努力将信息粘贴到fastcmd
python - 在聚类蛋白质数据中使用 ngram(ngram.NGram.compare 在 R 中等效)
有一些序列数据需要比较。预期的输出是距离矩阵,它显示了每个序列与其他序列的相似程度。以前,我ngram.NGram.compare
在 Python 中使用过,现在我想切换到 R。我找到ngram
并biogram
打包,但我无法找到生成预期输出的确切函数。
假设这是数据
输出应该是这样的(每个项目之间的距离):
它是输出的等效 Python 代码:
matrix - 使用 4×4 变换矩阵对 PDB 坐标应用连续变换
如何将 4*4 变换矩阵M
应用于一组 PDB 坐标以获得传播结构?
在将变换矩阵M
连续应用于起始 PDB 坐标后,我没有得到传播结构。但是在应用第二次连续变换后返回到起始坐标;作为M^2=I
. 请在下面找到矩阵。
我首先沿三个欧拉角进行旋转(由 3 x 3 矩阵表示,不包括第 4 行和第 4 列),然后沿 xyz 轴应用平移(分别为第 4 列的前三个条目)。
附加了受体(初始坐标)和配体(第一次转换后)数据集 [ 1 ]。而且,它们都代表具有相同3D构象的相同肽,只是它们在3D空间中的方向不同。
我想将下一个单体添加到复合物中(在配体之后),以便受体-配体对接模式进一步传播,如论文所示。根据目前的对接观察,它很可能会形成一个环形结构。
有什么办法可以摆脱我回到起始坐标而不是传播结构的当前情况?请检查文本、图像(结构传播所需模式的描述)[ 2 ]和下面给出的链接:
然后,我们使用对接旋转和平移参数连续对接每个二聚体的质心的附加副本(一次一个),正如在 Hex 程序选择的初始对接复杂配置中使用的那样,以扩展二聚体。该程序使用了对每个起始二聚体进行初步计算的三维 (3D) 转换矩阵。
python - 从 uniprotID 和特定残基中检索 13mer 肽序列
我有一个 UniprotID 列表,其中包含相应的感兴趣残基(例如 Q7TQ48_S 442)。我需要检索蛋白质序列内特定位点周围的 +/-6 个残基(在示例中,我需要的序列是 DIEAEA S EERQQE)。您能否建议一种方法来使用 Python、R 或已经可用的网络工具对 ID 列表 + 感兴趣的残基进行处理?谢谢, 伊曼纽尔
r - R蛋白质组学:输入文件“ExpressionSet”的问题:处理信息:msmsTest包
更新的问题:
我想使用 msmsTest 包来统计我的蛋白质组学数据(光谱计数类型)。
但是,使用以下命令导入文件时出现消息错误:
我认为我的问题来自上一步,当时我尝试以适当的格式生成文件,该文件应该是 ExpressionSet 文件。为此,我尝试逐步按照 ExpressionSetIntroduction 手册进行操作,这对我来说似乎没问题,但是每当我将命令“e <- pp.msms.data(myStackoverflowexample)”与 msmsTest 包一起使用时,我都会收到错误消息。
请帮助我,我被困了几个星期,这可能是我错过的一件非常愚蠢的事情。
您可以在此处获取示例数据集(原始数据和表型数据): https ://www.dropbox.com/s/o9ts4k5qrnyem6d/rawdata.txt?dl=0 https://www.dropbox.com/s/3oy6n6y5hfq30ee/pdata .txt?dl=0
下面是允许我从头开始构建 ExpressionSet 文件的代码:
所以在这段代码之后,我被 msmsTest 包卡住了:
如果我们查看手动示例,我们会看到键入时没有出现的“处理信息”行myStackoverflowexample
关于这个问题的任何线索,最终能够通过统计分析处理我的文件?
非常感谢您的帮助。
最初的(以及之前的)问题:
我想试试 msmsTest 包。
但是,当我使用示例数据集尝试手册中的代码时,出现以下错误消息:
所以我被困在那里,我不能再进一步了。
我试图将我的数据集定义为.data.frame() 或 as.matrix(),但我得到了相同的错误消息。
我已经阅读了 biobase 中有关 exprs() 函数的信息:“这些通用函数访问存储在从 eSet 类派生的对象中的化验数据的表达式和错误测量值。”
但这对我没有多大帮助......我已经阅读了一些与基因组数据的类似 exprs() 问题相关的帖子,但对我来说这听起来像是“胡言乱语”。显然,我的 data.frame 的 eSet 类结构可能有问题,但我不明白这意味着什么以及如何解决它。
有谁知道如何解决这个问题以及如何继续?
提前非常感谢,
亲切的问候,
天空R
r - 如何查找参数中字符出现的百分比?
如果数据是,我应该怎么做才能计算参数中字符出现的百分比
我想为此创建一个函数,这可能会帮助我将来计算更多问题。
假设我们的论点是——
此外,阅读框将从开头开始,以 3 的数量分开(例如-AUG,GUG)我得到了下面的代码,但我希望我的答案以列表的形式,有两列名为计数和百分比,请帮助我修改此代码以提供所需的百分比。
帮助我更正此代码我希望我的论点像 UGCUGCUAUGAAUGAUG 一样连续
python - 使用 Biopython 的 PDBIO 创建 PDB 文件时出现 TypeError,仅限某些文件
我正在编写一个重新编号蛋白质结构(CIF 文件)然后保存它们的脚本(PDB 文件:Biopython 没有 CIF 保存功能)。
对于我使用的大多数文件,它都有效。但是对于像 6ek0.pdb、5t2c.pdb 和 4v6x.pdb 这样的文件,对于 io.save 函数的同一行,我不断收到相同的 TypeError。当我不重新编号文件时,错误也存在,只有这样的输入和输出:
错误是:
我查看了代码和原子属性,但我看不出原子属性的类型有什么问题。atom_format_string 中的大部分部分都由 Biopython 彻底检查,所以我认为它们的类型是正确的。
我希望你能帮助我。如果我能做些什么来改善这个问题,请指出(我是新来的)。
编辑:要清楚,我想做的是
- 了解出了什么问题
- 保存结构