问题标签 [rdkit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
1205 浏览

python - 错误 MolFromSmiles - RDkit

当我在 python 中运行时:

我收到以下错误:

Boost.Python.ArgumentError:Python 参数类型在

rdkit.Chem.rdmolfiles.MolFromSmiles(str)

与 C++ 签名不匹配:

MolFromSmiles(std::string SMILES, bool sanitize=True, boost::python::dict replacements={})

Boost(1.54)和Rdkit(2013_09_1)的安装可以在之前的问题中找到:

RDKit 构建错误

有谁知道出了什么问题?

提前致谢。

0 投票
1 回答
5419 浏览

python - 将 matplotlib 图像插入熊猫数据框

目的:我目前正在使用 rdkit 为我的分子结构上色,根据rdkit.Chem.Draw.SimilarityMaps. 现在,我想使用 matplotlib imagesSimilarityMaps函数在 pandas 数据框中引入它们,并以 html 文件的形式导出该表。

代码:我尝试使用以下代码来做到这一点

当我打开文件test.html时,地图列包含信息“图(200x200)”。我检查我的数据框地图列是否包含对象:在 python 中可以,但在 html 文件中不行。

问题:我不确定如何获取带有图像的数据框,我希望社区能帮助我澄清这个问题。

提前致谢

0 投票
0 回答
314 浏览

python - 如何更快地搜索,RDkit 和 Pandas,化学数据库

我正在尝试搜索大型化学数据库(chembl,> 1,000,000 个条目),并且在我的工作计算机上执行代码时遇到问题。我们的重点是化学品,因此没有高质量的计算机。

我的代码在下面,可以快速处理较小的条目(> 5,000 个条目)。查看完整数据集时,我的 4GB 内存已满,计算机停止运行。有什么方法可以更有效地完成这项任务?

代码加载数据库,将微笑转换为 RDkit 分子信息,搜索并删除 MW 低于 50、高于 1000 的环或分子。

有小费吗?

0 投票
1 回答
776 浏览

python - RDKit 如何从指纹更改为 Mol 或 Smiles

我正在从微笑文件中聚集一些分子。我阅读它们,将它们转换为 mols,然后将它们转换为 Morgan Fingerprints,我用它来计算相似度,然后进行聚类。

但是我想将聚类结果输出到文件中。理想情况下,这是以微笑格式完成的,以便可以再次读取以进行评估。

请问这怎么做?

0 投票
1 回答
2058 浏览

python - 在 Conda 中运行 rdkit

我在 Conda 中运行 rdkit 时遇到问题。

我已经在 Windows 10 上安装了 Conda,然后在此处安装了 rdkit:http ://www.rdkit.org/docs/Install.html 。

当我conda list在 conda 命令提示符下运行时,列表中有 rdkit:

现在,当我激活 rdkit 环境 ( activate my-rdkit-env),然后启动 python ( python) 并尝试导入 rdkit,我遇到以下错误:

我实际上是在尝试在 Pycharm 中运行 Rdkit,但似乎我必须修复上面的错误。

0 投票
1 回答
187 浏览

python - 化学表示 - SNL 到 SMILES

我想知道是否可以使用 Python 将 SYBYL Line Notation (SNL) 转换为 Smiles?

N-甲基吡咯烷酮的例子:

我还没有找到任何使用 RDKit 的解决方案 :(

0 投票
1 回答
1435 浏览

python-3.x - 无法从 Anaconda Python 3.6.5 中的 rdkit 导入 Chem

我使用 Python 3.6.5 安装 Anaconda 4.5.4 并安装 rdkit(使用命令“ conda install -c rdkit rdkit”),我正在尝试导入 Chem 并且无法正常工作。

我怎样才能解决这个问题?我的错误在哪里?

谢谢!

0 投票
1 回答
87 浏览

python - 我怎样才能优化这个脚本,这样它就不需要一周的时间来完成它正在做的任务?(也使用了 BASH PARALLEL。)

我有一个包含 60,000 个文件的目录,这些文件由它们的 molid 命名。我有第二个 CSV 格式的文件,第 1 列中有 molid,第 2 列中有它们各自的 CHEMBLID。我需要将目录中的文件名 molid 与 CSV 文件中的 molid 匹配。如果找到匹配项,则将 chemblid 添加到文件中(重写文件以包含 chemblid)。我还使用 RDKit 来计算一些我需要写入修改文件的属性。我需要找到一种方法来优化它,因为我必须很快在 200 万个文件上运行它。

我与 arg parse 交互的方式是使用 bash 并行命令列出我目录中的所有 molid.sdf 文件。

csv 文件如下所示:

https://www.dropbox.com/s/6ynd9vbwwf6lqka/output_2.csv?dl=0

需要修改的文件如下所示:

https://www.dropbox.com/s/9r9kandkbahgexj/298512.sdf?dl=0

当前脚本工作方式的修改文件如下所示:

https://www.dropbox.com/s/dfcmiv7d298s1fl/298512.chembl.sdf?dl=0

0 投票
1 回答
4079 浏览

python - 来自图表的微笑

是否有将图形(或邻接矩阵)转换为 SMILES 字符串的方法或包?

例如,我知道原子是[6 6 7 6 6 6 6 8] ([C C N C C C C O]),邻接矩阵是

我需要一些功能来输出'CC1=NCCC(C)O1'

如果某些函数可以输出相应的"mol"对象,它也可以工作。RDkit 软件有一个'MolFromSmiles'功能。我想知道是否有类似的东西'MolFromGraphs'

0 投票
1 回答
1306 浏览

pandas - RDKit - 使用 mol 图像导出 pandas 数据框

我想知道是否可以直接以excel文件格式导出带有分子图像的熊猫数据框?

提前致谢,