我需要你的帮助。我有超过 40000 种 fasta 文件格式的蛋白质。
首先我想写一个函数:
- 能够计算 b 和 y 离子的质量
- 从目标蛋白创建肽数据库(mat-file)
- 创建来自诱饵蛋白的肽数据库(mat-file)
然后,我想:
- 加载观察到的数据
- 在给定 ppm 精度的情况下过滤肽数据库中的候选肽
- 编写一个函数,根据观察到的数据对候选肽进行评分
- 提出一个阈值方案来区分真正的肽谱匹配和虚假的匹配
我需要你的帮助。我有超过 40000 种 fasta 文件格式的蛋白质。
首先我想写一个函数:
然后,我想:
首先,FASTA 是文本文件格式。要编写文本文件fopen
,请查看fprintf
和的 MATLAB 文档fclose
。要从您编写的数据文件中加载文本,您可以使用fopen
,fscanf
和fclose
. 实际上,MATLABfastainfo
也fastaread
有fastawrite
。您应该查看这些命令以及其他可能对您有用的 FASTA 相关和蛋白质分析相关命令的 MATLAB 文档(我没有做过蛋白质分析,所以我不能说您需要哪些)。
此外,您在一个问题中问了很多事情,以至于不可能全部回答,因为您的问题恕我直言,有点像“我如何编写整个程序?”。但是我认为您可以开始使用我列出的命令,并且当您编写了一些代码并尝试解决了明确定义的问题时,您可以发布一个关于它的新问题,并附上相关的部分代码。
MATLAB 的生物信息学工具箱包含构建块例程,您可以将这些例程放在一起来实现此目的。如果您在将它们放在一起时遇到特定问题,请发布特定问题。