问题标签 [rdkit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - atom.GetIdx() 和 Chem.CanonicalRankAtoms() 的结果有什么区别?
在 RDKit 文档中,据说 rdkit.Chem.rdChem.GetIdx(Atom atom) 根据分子返回原子的索引。 https://www.rdkit.org/docs/source/rdkit.Chem.rdchem.html
rdkit.Chem.rdmolfiles.CanonicalRankAtoms (Mol mol) 返回分子中原子的规范排名。
https://www.rdkit.org/docs/source/rdkit.Chem.rdchem.html
我的问题是原子的规范等级与原子的索引有何不同?非常感谢您提前。
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] [8, 6, 9, 7, 2, 3, 0, 4, 5, 1]
python - 如何为 Python2 安装特定版本的 rdkit 库?
我需要安装 2019 年之前发布的 rdkit 库版本,当时对 Python 2 的支持已被删除。这是使用此库所必需的:https ://github.com/brain-research/deep-molecular-massspec
我已经从 git 页面下载了库,例如。https://github.com/rdkit/rdkit/releases/tag/Release_2018_09_1,并尝试使用 pip 从那里安装。
我收到以下错误:
处理 ./rdkit-Release_2018_09_1b1.tar.gz 命令 python setup.py egg_info 的完整输出:Traceback(最近一次调用最后一次):文件“”,第 1 行,在 IOError:[Errno 2] 没有这样的文件或目录:'/ tmp/pip-ohIcaj-build/setup.py'
我也尝试过使用 pip 安装特定版本:
这使:
收集 rdkit==2018.09.01 找不到满足要求的版本 rdkit==2018.09.01 (来自版本:)没有找到rdkit==2018.09.01的匹配分发
有人可以告诉我该怎么做吗?
svg - 从 RDKit 验证 SVG 文件
我正在尝试从包 RDKit 生成 SVG 图像。一个最小的可重现示例:
输出如下,但没有在我尝试过的任何浏览器或图像查看器中呈现任何图像。这是一个有效的 SVG 文件,还是产生无效格式的包?还是有其他我看不到的错误?
chemistry - 使用 RDKit 寻找手性
在论文:“ Graph Networks as a Universal Machine Learning Framework for Molecules and Crystals ”中,作者介绍了手性作为原子特征输入来分析 QM9 数据集。我试图重新创建这个原子功能如下
手性:(分类)R、S 或不是手性中心(单热编码)。
我使用的代码是:
输出显示此数据集没有手性中心。当我使用 时includeUnassigned=True
,代码给出了一个元组列表,但不是“R/S”,而是“?”。我想知道我的实现是否有错误。如果这是意料之中的,对上述论文中如何分配手性有任何想法吗?
python - 使用 RDKit 计算 sdf 文件和结构 SMILE 之间的 Tanimoto 相似性?
我正在使用带有 Python 3.7 的 RDKIt 来计算 sdf 中的数据库(每个结构的微笑)与一个分子的相似性,我对此微笑。我找到了一种仅使用以下代码在两个 SMILES 之间计算 Tanimoto 指数的方法:
有没有办法用 sdf 文件替换 mol1 ?
pip - 如何使用 pip 从 Conda 安装软件包 rdkit?
我正在尝试使用 pip3 安装 rdkit。但它不起作用。
conda 显然只有一种选择
如何使用 pip 安装它?谢谢
deep-learning - deepchem中图卷积的输出
我正在使用 Deepchem为我的 GraphConvolution模型创建特征,如下所示。
现在我想知道输出mol_object
。我知道dc.feat.graph_features.ConvMolFeaturizer()
返回一个数组对象。但它实际上对输入起作用。
所以featurizer.featurize(mols=molecules)
需要molecules
作为输入。将molecules[0]
打印以下图表。
作为molecules
一个列表,它仅包含索引 0 处的一个元素,即molecules[0]
. 这意味着mols
indc.feat.graph_features.ConvMolFeaturizer()
将此图像作为输入和输出mol_object
。
这个mol_object
输出是什么,我怎样才能看到它?是否表明它是一个数组,但我看不到这个数组的内容?
我如何检查或查看[<deepchem.feat.mol_graphs.ConvMol object at 0x7f96a68c6e48>]
?
python - Deepchem磁盘数据到numpy数组
我正在 为GraphConvolution模型使用Deepchem包装器,如下所示。我有我的微笑数据,其中包含 5 个分子,它们的微笑表示和各自的活动。可以直接从这里访问数据。.csv
导入库:
加载数据并以适合图形卷积的方式对其进行特征化。
分析加载和特征化的数据(我的尝试)
我想要的是?
从上面的代码中可以看出,dataset_train.X
给出了diskobject
like<deepchem.feat.mol_graphs.ConvMol object at 0x7f8bfc3ad6a0>
而不是numpy array
like dataset_train.y
。
我怎么知道存储在什么类型的数据中dataset_train.X
?如何查看存储的数据dataset_train.X
?或者换句话说,我怎样才能将它转换dataset_train.X
成可以检查其中数据的格式?
我相信应该有一些方法可以做到这一点。
python - 我需要从微笑字符串(或 .xyz 文件)中找到所有可能的键、分子中原子之间的角度的列表
我正在尝试开发力场,为了做到这一点,我需要一个来自微笑字符串 oe .xyz 文件的分子中所有可能的键、角和二面角的列表。
有可能用 RDkit 做到这一点吗?如果是这样,如何?
pandas - 在 Google Colab 上使用 AddMoleculeColumnToFrame 时出现问题
我一直在 Google Colab 上使用 AddMoleculeColumnToFrame 没有问题。大约 1 个月没有使用它后,我才发现它停止工作,即图像没有显示在数据框中(见下文)。
有任何想法吗?最可能的解释是 Google Colab 发生了一些变化。但是否也可能是新版本的 Pandas 导致了问题?
这是笔记本的链接和屏幕截图。
https://colab.research.google.com/drive/1nQPmdEbYQgVsFr7c44yRd3wpXPEsJar3