我正在研究一个读取 DNA 并找到其 RNA 的项目(我必须在 Perl 中实现它,但我不擅长它)。将该 RNA 分成三联体,以获得它的等效蛋白质名称。我将解释步骤:
1)将以下DNA转录为RNA,然后利用遗传密码将其翻译为氨基酸序列
例子:
TCATAATACGTTTTGTATTCGCCAGCGCTTCGGTGT
2) 要转录 DNA,首先将每个 DNA 替换为其对应物(即,G 替换 C,C 替换 G,T 替换 A,A 替换 T):
TCATAATACGTTTTGTATTCGCCAGCGCTTCGGTGT
AGTATTATGCAAAACATAAGCGGTCGCGAAGCCACA
接下来,请记住胸腺嘧啶 (T) 碱基变成了尿嘧啶 (U)。因此我们的序列变为:
AGUAUUAUGCAAAACAUAAGCGGUCGCGAAGCCACA
使用遗传密码就是这样
AGU AUU AUG CAA AAC AUA AGC GGU CGC GAA GCC ACA
然后在遗传密码表中查找每个三元组(密码子)。所以AGU变成了丝氨酸,我们可以写成Ser,或者只是S。AUU变成异亮氨酸(Ile),我们写成I。这样继续下去,我们得到:
SIMQNISGREAT
我将给出蛋白质表:
那么如何在 Perl 中编写该代码呢?我将编辑我的问题并编写我所做的代码。