问题标签 [rdkit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
31010 浏览

python - 如何解决 conda 代理配置中出现的错误?

我正在尝试在 ubuntu 上安装 Rdkit,但 conda 配置有问题。

我已经在我的桌面上重新安装了 anaconda3 和 python3 版本并从头开始安装。

当我运行命令时:conda create -c rdkit -n my-rdkit-env rdkit

我遇到的错误是这个:

有谁知道如何解决这个问题,以便我可以安装名为 Rdkit 的程序?

0 投票
1 回答
2783 浏览

python - 运行 rdkit.Chem.SaltRemover() 时出现 Python 参数错误。(Python 参数类型与 C++ 签名不匹配)

我正在使用一些任务RDKit并遇到一些问题。我正在尝试用SaltRemover()函数清理我的数据集,但是ArgumentError发生了,我无法弄清楚。

使用的代码是这样的:

运行代码后的错误信息是:

ArgumentError:rdkit.Chem.rdmolops.DeleteSubstructs(Mol, NoneType, bool) 中的 Python 参数类型与 C++ 签名不匹配:DeleteSubstructs(class RDKit::ROMol mol, class RDKit::ROMol query, bool onlyFrags=False, bool useChirality=错误的)

0 投票
0 回答
402 浏览

python-3.x - 在使用 ShapeTanimotoDist() 计算形状相似性之前在 Rdkit 中预对齐分子可能吗?

我正在构建一个脚本来比较 Rdkit 为查询配体生成的构象异构体与从模板蛋白质-配体复合物中提取的参考配体的形状。为此,我想使用ShapeTanimotoDist()Rdkit 提供的形状相似度 Tanimoto 度量。然而,在计算形状相似性时,这个函数似乎没有预先对齐分子。当我进行一些搜索时,我偶然发现了 10 年前的这个讨论,其中有人尝试过类似的事情:https ://sourceforge.net/p/rdkit/mailman/message/21906484/ 。

引用格雷格兰德鲁姆的话:

没有对齐步骤。如果你想要合理的形状比较,你首先需要合理的分子排列。RDKit 目前不提供进行这种对齐的实用方法。

所以我想知道从那时起这个问题是否已经解决,因此以独立的方式使用这个函数来比较分子的形状是合理的吗?在文档中,它声明ShapeTanimotoDist()它使用“预定义的对齐方式”,没有进一步详细说明。我查看了 Rdkit 提供的 2 个分子对齐功能的文档:AlignMol 和 Open3DAlign (O3A) https://www.rdkit.org/docs/source/rdkit.Chem.rdMolAlign.html。出于某种原因,AlignMol 对我不起作用(运行时错误),尽管自 2014 年以来 Rdkit 支持的 O3A 确实允许我将构象异构体与 ref 配体进行比较。但是,在创建 O3A 对象时,有没有办法以某种方式检索构象异构体的坐标和参考分子对齐以馈入ShapeTanimotoDist()? 也许还可以使用 PyMol 可视化?

干杯

也可能有用:RDkit 部分中的 3D 功能https://www.rdkit.org/docs/Cookbook.html

0 投票
2 回答
3284 浏览

python - 获取 ImportError /usr/lib/x86_64-linux-gnu/libstdc++.so.6:找不到版本“CXXABI_1.3.11”

我目前正在尝试运行一个使用 RDKit 并面临错误的 Python 程序。言归正传,完整的回溯是:

我已经查看了这个 Git Issue并尝试了那里的所有建议,但没有一个奏效。我还查看了以下 Stack Overflow 问题:uwsgi: /usr/lib/libstdc++.so.6: version `CXXABI_1.3.8' not found (required by /usr/lib/x86_64-linux-gnu/libicuuc .so.55/usr/lib/x86_64-linux-gnu/libstdc++.so.6: version CXXABI_1.3.8' not found [已关闭]但答案也无法解决我的问题。

有关更多信息:

  1. 操作系统:Ubuntu 16.04
  2. Python版本:3.7.5
  3. 的输出echo $LD_LIBRARY_PATH目前什么都没有(我试图将其设置为答案所建议的内容)。
  4. 我目前正在使用 Conda 环境,并且还从 Anaconda 下载了 RDKit。

有人知道潜在的问题可能是什么吗?我有点困惑,因为似乎没有任何工作,我不知道从哪里开始诊断问题。提前致谢。

0 投票
1 回答
207 浏览

python-3.x - 我可以在 Windows 操作系统中使用带有纯 python3 的 RDkit

我想在 Windows 操作系统中使用 RDkit 和 python3

但这里有一些我很困惑

除了作者说最推荐的方法是anaconda(我不想要这个),另一种方法是安装带有发布二进制包的RDkit。但是,当我按照 BELLOW 的方式关注文档时:

  • 从以下位置获取适当的 Windows 二进制构建:https://github.com/rdkit/rdkit/releases
  • 在名称中没有空格的地方提取 zip 文件,即 C:\
  • 其余部分将假定安装在 C:\RDKit_2015_09_2
  • 设置以下环境变量:
  • RDBASE: C:\RDKit_2015_09_2
  • PYTHONPATH: %RDBASE% 如果已经有一个 PYTHONPATH,把 ;%RDBASE% 放在最后。
  • 路径:添加 ;%RDBASE%\lib 到末尾


    我确实得到了最新版本

    我解压缩包

    但该目录在最后一步中没有子目录名称“lib”:PATH: add ;%RDBASE%\lib 到最后

    我能做些什么?我在那里 mkdir 命名为 lib 吗?或者只是二进制包不完整?

    另外,如果我想使用编译源代码的方式,示例环境是python2.7,我可以用python3编译吗?

  • 0 投票
    1 回答
    204 浏览

    python-3.x - 无法访问 rdkit 中 Chem.Atom 子类中的实例属性

    我定义了Atomin的一个子类rdkit.Chem。我还在其中定义了一个实例属性,但我无法从RWMolrdkit 中的对象获取该实例。

    下面是我的问题的示例代码:

    通常,此代码必须运行,但由于最后一行,它会给出错误,因为atom_in_mol objecttype 是Chem.Atom. 但它应该是MyAtom吗?我也无法my_attribute直接访问。

    rdkit Python 库是 C++ 的包装器。那么问题是这个吗?我不能对这个库使用继承吗?

    注意:我研究了 rdkit 文档,并且有一种SetProp将值保存在原子中的方法。它使用字典来保存值。它运行良好,但对我的项目来说太慢了。我想使用实例属性来保存我的额外值。有没有针对该继承问题的解决方案,或者更快的不同解决方案?

    0 投票
    1 回答
    81 浏览

    pyspark - Pyspark 字符串与 == 比较 RDkit 函数会引发错误

    我有一个 Pyspark UDF 定义如下 -

    data_converted.converted_smile 和 converted_smile_in 之间的比较会引发错误。我为 convert_smile 打印了大约 20 个值,看起来不错。我们不能这样进行字符串比较吗?

    Boost.Python.ArgumentError:rdkit.Chem.rdmolfiles.MolToSmiles(NoneType) 中的 Python 参数类型与 C++ 签名不匹配:MolToSmiles(RDKit::ROMol mol, bool isomericSmiles=True, bool kekuleSmiles=False, int rootedAtAtom=-1, bool canonical=True, bool allBondsExplicit=False, bool allHsExplicit=False, bool doRandom=False)

    0 投票
    2 回答
    3007 浏览

    rdkit - RDKit:如何检查分子是否完全匹配?

    我正在使用 RDKit 并尝试检查分子是否完全匹配。使用Chem.MolFromSmiles()表达式后m == p显然不会导致预期的结果。当然,我可以检查是否p是 的子结构m以及是否m是 的子结构p。但对我来说,这看起来太复杂了。我在 RDKit 文档中找不到或忽略了完全匹配的代码示例。我该如何正确地做到这一点?谢谢你的提示。

    代码:

    0 投票
    1 回答
    248 浏览

    python - 使用 rdkit 加速实现化合物规范微笑的相似性

    这个想成为生物信息学家的人需要你的帮助。下面的代码使用 rdkit 查找化合物规范微笑的相似性。经过一番研究,我明白它必须是 O(n)!(或者不是?)因为对于一个包含 944 个条目的小文件,它需要 20 分钟,而对于最大的一个,即 330.000 个条目,它已经运行了 30 多个小时。现在,我现在知道它的一个问题是它不会只比较元素一次,所以这是减慢它的一个因素。我在这里读到,您可以使用 itertools 库进行快速比较,但通常如何才能使这段代码变得更好?在我尝试学习时,任何帮助将不胜感激:)

    0 投票
    0 回答
    472 浏览

    python - 使用 RDKIT:以整数/计数形式生成指纹

    我是 Rdkit 的新手。我需要以整数/计数形式生成指纹。我尝试了很多替代方法,但总是收到以下信息:

    我的代码如下:

    我还想知道 Rdkit 中是否有一种方法可以将指纹直接打印到文本文件中,类似于Chem.SDwrite但要保存指纹?但是,如果我可以将计数指纹转换为数组,那么我可以使用 Python 代码保存到文本文件。