我制作了一个模型来根据分子的摩根指纹预测分子的溶解度,现在我发现了该模型很难预测的特定指纹位。我想看看指纹的每一位与分子结构的相关性,感谢用户rapelpy,我找到了DrawMorganBits,但在这里我需要分子的mol(或Smiles),我只有一个非-特异性分子。
是否可以从指纹中获取 mol 或 smiles 代码,或者我可以通过其他方式仅用指纹绘制结构吗?
提前致谢。
我制作了一个模型来根据分子的摩根指纹预测分子的溶解度,现在我发现了该模型很难预测的特定指纹位。我想看看指纹的每一位与分子结构的相关性,感谢用户rapelpy,我找到了DrawMorganBits,但在这里我需要分子的mol(或Smiles),我只有一个非-特异性分子。
是否可以从指纹中获取 mol 或 smiles 代码,或者我可以通过其他方式仅用指纹绘制结构吗?
提前致谢。
您可以DrawMorganBit()
按照RDKit-Blog中的说明使用
如果您只有一个分子指纹,则很难追溯到导致每个位被设置的子结构——甚至可能是不可能的,具体取决于您使用的指纹。
在上面的 RDKit 博客中,bitInfo
dict 正在捕获负责在“折叠”/“散列”指纹之前设置位的子结构。散列的过程会导致位冲突,因此如果没有这个字典,就不可能确定地映射回来。
bitInfo
如果您有意志力并且确实无法跟踪,您可以尝试生成设置您感兴趣的位的结构(或随机抽样结构),这将让您猜测最初可能负责哪些子结构。
一个起点可能是GuacaMol 基准代码库,其中包括可以从指纹生成分子的任务和基线方法。