问题标签 [rdkit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
370 浏览

python - atom.GetIdx() 和 Chem.CanonicalRankAtoms() 的结果有什么区别?

在 RDKit 文档中,据说 rdkit.Chem.rdChem.GetIdx(Atom atom) 根据分子返回原子的索引。 https://www.rdkit.org/docs/source/rdkit.Chem.rdchem.html

rdkit.Chem.rdmolfiles.CanonicalRankAtoms (Mol mol) 返回分子中原子的规范排名。

https://www.rdkit.org/docs/source/rdkit.Chem.rdchem.html

我的问题是原子的规范等级与原子的索引有何不同?非常感谢您提前。

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] [8, 6, 9, 7, 2, 3, 0, 4, 5, 1]

0 投票
3 回答
3659 浏览

python - 如何为 Python2 安装特定版本的 rdkit 库?

我需要安装 2019 年之前发布的 rdkit 库版本,当时对 Python 2 的支持已被删除。这是使用此库所必需的:https ://github.com/brain-research/deep-molecular-massspec

我已经从 git 页面下载了库,例如。https://github.com/rdkit/rdkit/releases/tag/Release_2018_09_1,并尝试使用 pip 从那里安装。

我收到以下错误:

处理 ./rdkit-Release_2018_09_1b1.tar.gz 命令 python setup.py egg_info 的完整输出:Traceback(最近一次调用最后一次):文件“”,第 1 行,在 IOError:[Errno 2] 没有这样的文件或目录:'/ tmp/pip-ohIcaj-build/setup.py'

我也尝试过使用 pip 安装特定版本:

这使:

收集 rdkit==2018.09.01 找不到满足要求的版本 rdkit==2018.09.01 (来自版本:)没有找到rdkit==2018.09.01的匹配分发

有人可以告诉我该怎么做吗?

0 投票
1 回答
577 浏览

svg - 从 RDKit 验证 SVG 文件

我正在尝试从包 RDKit 生成 SVG 图像。一个最小的可重现示例:

输出如下,但没有在我尝试过的任何浏览器或图像查看器中呈现任何图像。这是一个有效的 SVG 文件,还是产生无效格式的包?还是有其他我看不到的错误?

0 投票
0 回答
118 浏览

chemistry - 使用 RDKit 寻找手性

在论文:“ Graph Networks as a Universal Machine Learning Framework for Molecules and Crystals ”中,作者介绍了手性作为原子特征输入来分析 QM9 数据集。我试图重新创建这个原子功能如下

手性:(分类)R、S 或不是手性中心(单热编码)。

我使用的代码是:

输出显示此数据集没有手性中心。当我使用 时includeUnassigned=True,代码给出了一个元组列表,但不是“R/S”,而是“?”。我想知道我的实现是否有错误。如果这是意料之中的,对上述论文中如何分配手性有任何想法吗?

0 投票
1 回答
944 浏览

python - 使用 RDKit 计算 sdf 文件和结构 SMILE 之间的 Tanimoto 相似性?

我正在使用带有 Python 3.7 的 RDKIt 来计算 sdf 中的数据库(每个结构的微笑)与一个分子的相似性,我对此微笑。我找到了一种仅使用以下代码在两个 SMILES 之间计算 Tanimoto 指数的方法:

有没有办法用 sdf 文件替换 mol1 ?

0 投票
2 回答
11151 浏览

pip - 如何使用 pip 从 Conda 安装软件包 rdkit?

我正在尝试使用 pip3 安装 rdkit。但它不起作用。

conda 显然只有一种选择

如何使用 pip 安装它?谢谢

0 投票
1 回答
594 浏览

deep-learning - deepchem中图卷积的输出

我正在使用 Deepchem为我的 GraphConvolution模型创建特征,如下所示。

现在我想知道输出mol_object。我知道dc.feat.graph_features.ConvMolFeaturizer()返回一个数组对象。但它实际上对输入起作用。

所以featurizer.featurize(mols=molecules)需要molecules作为输入。将molecules[0]打印以下图表。

毫升

作为molecules一个列表,它仅包含索引 0 处的一个元素,即molecules[0]. 这意味着molsindc.feat.graph_features.ConvMolFeaturizer()将此图像作为输入和输出mol_object

这个mol_object输出是什么,我怎样才能看到它?是否表明它是一个数组,但我看不到这个数组的内容?

我如何检查或查看[<deepchem.feat.mol_graphs.ConvMol object at 0x7f96a68c6e48>]

0 投票
1 回答
341 浏览

python - Deepchem磁盘数据到numpy数组

我正在 为GraphConvolution模型使用Deepchem包装器,如下所示。我有我的微笑数据,其中包含 5 个分子,它们的微笑表示和各自的活动。可以直接从这里访问数据。.csv

导入库:

加载数据并以适合图形卷积的方式对其进行特征化。

分析加载和特征化的数据(我的尝试)

我想要的是?

从上面的代码中可以看出,dataset_train.X给出了diskobjectlike<deepchem.feat.mol_graphs.ConvMol object at 0x7f8bfc3ad6a0>而不是numpy arraylike dataset_train.y

我怎么知道存储在什么类型的数据中dataset_train.X?如何查看存储的数据dataset_train.X?或者换句话说,我怎样才能将它转换dataset_train.X成可以检查其中数据的格式?

我相信应该有一些方法可以做到这一点。

0 投票
1 回答
858 浏览

python - 我需要从微笑字符串(或 .xyz 文件)中找到所有可能的键、分子中原子之间的角度的列表

我正在尝试开发力场,为了做到这一点,我需要一个来自微笑字符串 oe .xyz 文件的分子中所有可能的键、角和二面角的列表。

有可能用 RDkit 做到这一点吗?如果是这样,如何?

0 投票
1 回答
289 浏览

pandas - 在 Google Colab 上使用 AddMoleculeColumnToFrame 时出现问题

我一直在 Google Colab 上使用 AddMoleculeColumnToFrame 没有问题。大约 1 个月没有使用它后,我才发现它停止工作,即图像没有显示在数据框中(见下文)。

有任何想法吗?最可能的解释是 Google Colab 发生了一些变化。但是否也可能是新版本的 Pandas 导致了问题?

这是笔记本的链接和屏幕截图。

https://colab.research.google.com/drive/1nQPmdEbYQgVsFr7c44yRd3wpXPEsJar3

在此处输入图像描述