问题标签 [rdkit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 错误 MolFromSmiles - RDkit
当我在 python 中运行时:
我收到以下错误:
Boost.Python.ArgumentError:Python 参数类型在
rdkit.Chem.rdmolfiles.MolFromSmiles(str)
与 C++ 签名不匹配:
MolFromSmiles(std::string SMILES, bool sanitize=True, boost::python::dict replacements={})
Boost(1.54)和Rdkit(2013_09_1)的安装可以在之前的问题中找到:
有谁知道出了什么问题?
提前致谢。
python - 将 matplotlib 图像插入熊猫数据框
目的:我目前正在使用 rdkit 为我的分子结构上色,根据rdkit.Chem.Draw.SimilarityMaps
. 现在,我想使用 matplotlib imagesSimilarityMaps
函数在 pandas 数据框中引入它们,并以 html 文件的形式导出该表。
代码:我尝试使用以下代码来做到这一点
当我打开文件test.html
时,地图列包含信息“图(200x200)”。我检查我的数据框地图列是否包含对象:在 python 中可以,但在 html 文件中不行。
问题:我不确定如何获取带有图像的数据框,我希望社区能帮助我澄清这个问题。
提前致谢
python - 如何更快地搜索,RDkit 和 Pandas,化学数据库
我正在尝试搜索大型化学数据库(chembl,> 1,000,000 个条目),并且在我的工作计算机上执行代码时遇到问题。我们的重点是化学品,因此没有高质量的计算机。
我的代码在下面,可以快速处理较小的条目(> 5,000 个条目)。查看完整数据集时,我的 4GB 内存已满,计算机停止运行。有什么方法可以更有效地完成这项任务?
代码加载数据库,将微笑转换为 RDkit 分子信息,搜索并删除 MW 低于 50、高于 1000 的环或分子。
有小费吗?
python - RDKit 如何从指纹更改为 Mol 或 Smiles
我正在从微笑文件中聚集一些分子。我阅读它们,将它们转换为 mols,然后将它们转换为 Morgan Fingerprints,我用它来计算相似度,然后进行聚类。
但是我想将聚类结果输出到文件中。理想情况下,这是以微笑格式完成的,以便可以再次读取以进行评估。
请问这怎么做?
python - 在 Conda 中运行 rdkit
我在 Conda 中运行 rdkit 时遇到问题。
我已经在 Windows 10 上安装了 Conda,然后在此处安装了 rdkit:http ://www.rdkit.org/docs/Install.html 。
当我conda list
在 conda 命令提示符下运行时,列表中有 rdkit:
现在,当我激活 rdkit 环境 ( activate my-rdkit-env
),然后启动 python ( python
) 并尝试导入 rdkit,我遇到以下错误:
我实际上是在尝试在 Pycharm 中运行 Rdkit,但似乎我必须修复上面的错误。
python - 化学表示 - SNL 到 SMILES
我想知道是否可以使用 Python 将 SYBYL Line Notation (SNL) 转换为 Smiles?
N-甲基吡咯烷酮的例子:
我还没有找到任何使用 RDKit 的解决方案 :(
python-3.x - 无法从 Anaconda Python 3.6.5 中的 rdkit 导入 Chem
我使用 Python 3.6.5 安装 Anaconda 4.5.4 并安装 rdkit(使用命令“ conda install -c rdkit rdkit
”),我正在尝试导入 Chem 并且无法正常工作。
我怎样才能解决这个问题?我的错误在哪里?
谢谢!
python - 我怎样才能优化这个脚本,这样它就不需要一周的时间来完成它正在做的任务?(也使用了 BASH PARALLEL。)
我有一个包含 60,000 个文件的目录,这些文件由它们的 molid 命名。我有第二个 CSV 格式的文件,第 1 列中有 molid,第 2 列中有它们各自的 CHEMBLID。我需要将目录中的文件名 molid 与 CSV 文件中的 molid 匹配。如果找到匹配项,则将 chemblid 添加到文件中(重写文件以包含 chemblid)。我还使用 RDKit 来计算一些我需要写入修改文件的属性。我需要找到一种方法来优化它,因为我必须很快在 200 万个文件上运行它。
我与 arg parse 交互的方式是使用 bash 并行命令列出我目录中的所有 molid.sdf 文件。
csv 文件如下所示:
https://www.dropbox.com/s/6ynd9vbwwf6lqka/output_2.csv?dl=0
需要修改的文件如下所示:
https://www.dropbox.com/s/9r9kandkbahgexj/298512.sdf?dl=0
当前脚本工作方式的修改文件如下所示:
https://www.dropbox.com/s/dfcmiv7d298s1fl/298512.chembl.sdf?dl=0
python - 来自图表的微笑
是否有将图形(或邻接矩阵)转换为 SMILES 字符串的方法或包?
例如,我知道原子是[6 6 7 6 6 6 6 8] ([C C N C C C C O])
,邻接矩阵是
我需要一些功能来输出'CC1=NCCC(C)O1'
。
如果某些函数可以输出相应的"mol"
对象,它也可以工作。RDkit 软件有一个'MolFromSmiles'
功能。我想知道是否有类似的东西'MolFromGraphs'
。
pandas - RDKit - 使用 mol 图像导出 pandas 数据框
我想知道是否可以直接以excel文件格式导出带有分子图像的熊猫数据框?
提前致谢,