我正在处理 .smiles 文件。.smiles 文件的文件结构是:http ://en.wikipedia.org/wiki/Chemical_file_format#SMILES
我想从微笑文件中获取所有原子。这意味着如果有单个“C”原子,则意味着将有 4 个“H”原子连接到它们。
我在搜索时发现 python 中有一些模块可以解析微笑格式,但它们不提供支持的氢原子。(例如:他们只给出'C'而不是其他4个'H'原子连接到那个'C'原子)
如何使用 python 找到所有原子,包括连接的“H”原子。
需要转换为所有原子的微笑文件示例,包括连接的“H”原子:
[H]OC([H])([H])[C@@]1([H])C([H])=C([H])[C@@]([H])(n2c([H])nc3c(nc(nc23)N([H])[H])N([H])C2([H])C([H])([H])C2([H])[H])C1([H])[H]
先感谢您。