0

我正在尝试使用 Porter5 对包含一堆蛋白质序列的 FASTA 文件运行蛋白质二级结构预测。我正在使用 Linux 机器。

对于初学者,我决定尝试使用随 Porter5 一起下载的示例文件,名为2FLGA.fasta. 我使用的命令是我在 Porter5 的 GitHub 页面上找到的(https://github.com/mircare/Porter5/

$ python3 Porter5.py -i example/2FLGA.fasta --cpu 4

我收到以下错误消息:

sh: 1: /home/user/ncbi-blast-2.8.1+/bin/psiblast: not found
PSI-BLAST executed in 0.01s
wc: example/2FLGA.fasta.psi: No such file or directory
awk: cannot open example/2FLGA.fasta.psi (No such file or directory)
HHblits executed in 0.01s
Traceback (most recent call last):
  File "/home/user/Porter5/scripts/process-alignment.py", line 37, in <module>
    sequences = lines[0] = len(lines) - 1
IndexError: list assignment index out of range
Traceback (most recent call last):
  File "Porter5.py", line 80, in <module>
    flatpsi_ann = open(filename+".flatpsi.ann", "r").readlines()
FileNotFoundError: [Errno 2] No such file or directory: 'example/2FLGA.fasta.flatpsi.ann'

在 PSI-BLAST 之后,Porter5 脚本需要一个名为2FLGA.fasta.psi. 我检查了example目录,它包含一个名为2FLGA.fasta.flatpsi.

我不确定在这里做什么。我不想尝试修改任何 Porter5 脚本来查找.flatpsi文件而不是.psi文件,因为我是编程的初学者,并且我不希望通过篡改代码来破坏一切。

有人可以帮我吗?任何帮助表示赞赏。

(有一堆错误需要稍后进行协商,但我会在处理第一个错误后看到这些错误。)

4

1 回答 1

0

我是 Porter5 的作者,我通常建议直接在 GitHub 上打开一个问题,因为否则我不会收到任何通知。

看起来 psiblast 的路径是错误的(错误消息的第一行)。您可以使用以下命令进行检查:

$ ls /home/user/ncbi-blast-2.8.1+/bin/psiblast

此外,HHblits 的可执行文件或数据库的路径是错误的,或者两者都有。您可以检查如下(在 Porter5/ 中):

$ cat 脚本/config.ini

您可以编辑scripts/config.ini或运行以下命令,直到 Porter5 成功运行:

$ python3 Porter5.py -i 示例/2FLGA.fasta --cpu 4 --setup

.flatpsi是一个中间文件,如果 HHblits 没有成功运行,它不包含有效的表示)

于 2019-08-08T10:09:09.077 回答