问题标签 [rdkit]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

178 问题

0 投票

0 回答

1205 浏览

python - 错误 MolFromSmiles - RDkit

当我在 python 中运行时：

我收到以下错误：

Boost.Python.ArgumentError：Python 参数类型在

rdkit.Chem.rdmolfiles.MolFromSmiles(str)

与 C++ 签名不匹配：

MolFromSmiles(std::string SMILES, bool sanitize=True, boost::python::dict replacements={})

Boost（1.54）和Rdkit（2013_09_1）的安装可以在之前的问题中找到：

RDKit 构建错误。

有谁知道出了什么问题？

提前致谢。

python c++boost rdkit

2017-10-11T08:21:16.090

0 投票

1 回答

5419 浏览

python - 将 matplotlib 图像插入熊猫数据框

目的：我目前正在使用 rdkit 为我的分子结构上色，根据rdkit.Chem.Draw.SimilarityMaps. 现在，我想使用 matplotlib imagesSimilarityMaps函数在 pandas 数据框中引入它们，并以 html 文件的形式导出该表。

代码：我尝试使用以下代码来做到这一点

当我打开文件test.html时，地图列包含信息“图（200x200）”。我检查我的数据框地图列是否包含对象：在 python 中可以，但在 html 文件中不行。

问题：我不确定如何获取带有图像的数据框，我希望社区能帮助我澄清这个问题。

提前致谢

python pandas matplotlib rdkit

2017-10-31T15:03:44.980

0 投票

0 回答

314 浏览

python - 如何更快地搜索，RDkit 和 Pandas，化学数据库

我正在尝试搜索大型化学数据库（chembl，> 1,000,000 个条目），并且在我的工作计算机上执行代码时遇到问题。我们的重点是化学品，因此没有高质量的计算机。

我的代码在下面，可以快速处理较小的条目（> 5,000 个条目）。查看完整数据集时，我的 4GB 内存已满，计算机停止运行。有什么方法可以更有效地完成这项任务？

代码加载数据库，将微笑转换为 RDkit 分子信息，搜索并删除 MW 低于 50、高于 1000 的环或分子。

有小费吗？

python database pandas optimization rdkit

2017-11-16T14:47:33.160

0 投票

1 回答

776 浏览

python - RDKit 如何从指纹更改为 Mol 或 Smiles

我正在从微笑文件中聚集一些分子。我阅读它们，将它们转换为 mols，然后将它们转换为 Morgan Fingerprints，我用它来计算相似度，然后进行聚类。

但是我想将聚类结果输出到文件中。理想情况下，这是以微笑格式完成的，以便可以再次读取以进行评估。

请问这怎么做？

python rdkit

2018-05-10T21:35:03.137

0 投票

1 回答

2058 浏览

python - 在 Conda 中运行 rdkit

我在 Conda 中运行 rdkit 时遇到问题。

我已经在 Windows 10 上安装了 Conda，然后在此处安装了 rdkit：http ://www.rdkit.org/docs/Install.html 。

当我conda list在 conda 命令提示符下运行时，列表中有 rdkit：

现在，当我激活 rdkit 环境 ( activate my-rdkit-env)，然后启动 python ( python) 并尝试导入 rdkit，我遇到以下错误：

我实际上是在尝试在 Pycharm 中运行 Rdkit，但似乎我必须修复上面的错误。

python pycharm anaconda rdkit

2018-05-13T16:58:23.337

0 投票

1 回答

187 浏览

python - 化学表示 - SNL 到 SMILES

我想知道是否可以使用 Python 将 SYBYL Line Notation (SNL) 转换为 Smiles？

N-甲基吡咯烷酮的例子：

我还没有找到任何使用 RDKit 的解决方案 :(

python rdkit cheminformatics

2018-05-20T13:13:14.973

0 投票

1 回答

1435 浏览

python-3.x - 无法从 Anaconda Python 3.6.5 中的 rdkit 导入 Chem

我使用 Python 3.6.5 安装 Anaconda 4.5.4 并安装 rdkit（使用命令“ conda install -c rdkit rdkit”），我正在尝试导入 Chem 并且无法正常工作。

我怎样才能解决这个问题？我的错误在哪里？

谢谢！

python-3.x anaconda ubuntu-18.04 rdkit

2018-06-13T13:15:25.400

0 投票

1 回答

87 浏览

python - 我怎样才能优化这个脚本，这样它就不需要一周的时间来完成它正在做的任务？（也使用了 BASH PARALLEL。）

我有一个包含 60,000 个文件的目录，这些文件由它们的 molid 命名。我有第二个 CSV 格式的文件，第 1 列中有 molid，第 2 列中有它们各自的 CHEMBLID。我需要将目录中的文件名 molid 与 CSV 文件中的 molid 匹配。如果找到匹配项，则将 chemblid 添加到文件中（重写文件以包含 chemblid）。我还使用 RDKit 来计算一些我需要写入修改文件的属性。我需要找到一种方法来优化它，因为我必须很快在 200 万个文件上运行它。

我与 arg parse 交互的方式是使用 bash 并行命令列出我目录中的所有 molid.sdf 文件。

csv 文件如下所示：

https://www.dropbox.com/s/6ynd9vbwwf6lqka/output_2.csv?dl=0

需要修改的文件如下所示：

https://www.dropbox.com/s/9r9kandkbahgexj/298512.sdf?dl=0

当前脚本工作方式的修改文件如下所示：

https://www.dropbox.com/s/dfcmiv7d298s1fl/298512.chembl.sdf?dl=0

python bash csv argparse rdkit

2018-06-25T17:47:52.580

0 投票

1 回答

4079 浏览

python - 来自图表的微笑

是否有将图形（或邻接矩阵）转换为 SMILES 字符串的方法或包？

例如，我知道原子是[6 6 7 6 6 6 6 8] ([C C N C C C C O])，邻接矩阵是

我需要一些功能来输出'CC1=NCCC(C)O1'。

如果某些函数可以输出相应的"mol"对象，它也可以工作。RDkit 软件有一个'MolFromSmiles'功能。我想知道是否有类似的东西'MolFromGraphs'。

python bioinformatics rdkit cheminformatics

2018-07-05T15:44:41.123

0 投票

1 回答

1306 浏览

pandas - RDKit - 使用 mol 图像导出 pandas 数据框

我想知道是否可以直接以excel文件格式导出带有分子图像的熊猫数据框？

提前致谢，

pandas rdkit

2018-07-16T07:08:15.657

1 2 3 4 5 6 7 8 9 10

问题标签 [rdkit]

Reference