我目前正在使用 PDB 数据集,我对残基的大小(每个残基的原子数)感兴趣。我意识到原子数 -len(residue.child_list) - 与不同蛋白质中的残基不同,即使是相同的残基。例如:残基“LEU”在一种蛋白质中有 8 个原子,但在另一种蛋白质中有 19 个!
我的猜测是 PDB 或 PDBParser() 中的错误,但差异很大!
例如在分子 3OQ2 的情况下:
r = model['B'][88]
r1 = model['B'][15] # residue at chain B position 15
In [287]: r.resname
Out[287]: 'VAL'
In [288]: r1.resname
Out[288]: 'VAL'
但
In [274]: len(r.child_list)
Out[274]: 16
In [276]: len(r1.child_list)
Out[276]: 7
因此,即使在单个分子内,原子数也存在差异。我想知道这在生物学上是否正常,或者是否有问题。谢谢你。
强文本