rdkit - 从摩根指纹、RDKit 中获取结构

Question

我制作了一个模型来根据分子的摩根指纹预测分子的溶解度，现在我发现了该模型很难预测的特定指纹位。我想看看指纹的每一位与分子结构的相关性，感谢用户rapelpy，我找到了DrawMorganBits，但在这里我需要分子的mol（或Smiles），我只有一个非-特异性分子。

是否可以从指纹中获取 mol 或 smiles 代码，或者我可以通过其他方式仅用指纹绘制结构吗？

提前致谢。

score 2 · Accepted Answer

2

您可以DrawMorganBit()按照RDKit-Blog中的说明使用

于 2020-03-22T07:18:28.963 回答

score 0 · Accepted Answer

如果您只有一个分子指纹，则很难追溯到导致每个位被设置的子结构——甚至可能是不可能的，具体取决于您使用的指纹。

在上面的 RDKit 博客中，bitInfodict 正在捕获负责在“折叠”/“散列”指纹之前设置位的子结构。散列的过程会导致位冲突，因此如果没有这个字典，就不可能确定地映射回来。

bitInfo如果您有意志力并且确实无法跟踪，您可以尝试生成设置您感兴趣的位的结构（或随机抽样结构），这将让您猜测最初可能负责哪些子结构。

一个起点可能是GuacaMol 基准代码库，其中包括可以从指纹生成分子的任务和基线方法。

2 回答 2