问题标签 [rdkit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
224 浏览

django - rdikit安装和导入错误

导入 rdkit 时出现此错误。Traceback(最近一次调用

我已将我的 .bashrc 文件编辑为此

同样在 PyCharm 中编辑了设置以添加带有 RDkit 位置的内容根,并将 ENV 变量设置为指向 RDkit lib 位置。我仍然有同样的错误。


是否还有其他我忽略的配置过程。谢谢

0 投票
0 回答
1109 浏览

python - 将数组转换为 Numpy 数组更改值

我正在使用 RDKit 包将一些 SMILES 转换为指纹。

我的问题,我使用 Scikit learn,我想做一份简历。对于 CV,我需要 np.array 数据结构...对于指纹类型,我将数据结构转换为 0 和 1 的结构。这里只是一个任意的例子

print x: 一个 vektor 包含很多:rdkit.DataStructs.cDataStructs.ExplicitBitVect object at 0x05E498F0 objects will be createt

x=np.array(x) print x:将创建一个由 1 和 0 组成的向量。

我不知道为什么 numpy 数组转换,改变类型?

对于 0x05DDF960 处的 rdkit.DataStructs.cDataStructs.LongSparseIntVect 对象之类的对象,numpy 将向量更改为相同的结构。

我只是问,因为从 4 个指纹中的 2 个,由于 numpy 转换,我得到了这个错误:

AttributeError:“numpy.ndarray”对象没有指纹摩根的属性“GetNumBits”

Drücken Sie eine beliebige 味道。. . 打印帧率

0 投票
2 回答
3674 浏览

python - 如何在 PyCharm 中将 RDKit 添加到项目中?

所以,我正在尝试将 RDKit 添加到我在 PyCharm 中的项目中。我发现如果你使用解释器/usr/bin/python2.7PyCharm 会尝试使用pip. 同时,RDKit 需要conda. 我试图将解释器更改为conda,但RDKit不在列表中,或者无法打开带有 repo 的 URL。有谁知道如何解决这个问题?

顺便说一句,在安装东西的同时,是否有可能让解释器/usr/bin/python2.7使用其他任何东西(不是pip)?

0 投票
0 回答
500 浏览

r - Rrdkit - 使用 install_github/devtools/timeout 问题时出错

系统: Linux - CentOS 6.5

R 版本: 3.2.3(64 位)

我在这里暴露了同样的错误:

我测试了 maddy2u 的解决方案,但它在我的工作站上无法使用options(download.file.method = "wget")or options(download.file.method = "libcurl")。我尝试了很多东西,但我没有解决这个问题的想法。

欢迎任何帮助,并提前致谢。

0 投票
2 回答
8423 浏览

python - Anaconda 的 rdkit 安装问题

我正在尝试使用 Anaconda 和 Python 2.7 让 rdkit 在我的 Windows 7 系统上运行。我一直按照http://www.rdkit.org/docs/Install.html的说明进行操作

然后我得到以下信息:

停用环境“C:\Anaconda2”...

激活环境“C:\Anaconda2\envs\my-rdkit-env”

但是,如果我随后打开一个 Jupyter 笔记本,并尝试

它失败了

ImportError:没有名为 rdkit 的模块

任何帮助将不胜感激!

0 投票
1 回答
760 浏览

python - 为化学指纹选择 n 个簇

您好,我正在尝试对化学指纹进行聚类

我正在使用为集群提供分层方法的 rdkit,问题是我知道我想要拥有 13 个集群的集群数量,所以我使用基于 scikit 的 tanimoto 相似度得分的 kmean 方法

这是我的代码:

聚类似乎以某种方式起作用,但我不知道我们如何对化学指纹进行聚类,我们是否应该将聚类算法直接应用于指纹本身?

0 投票
1 回答
494 浏览

python - 在同一熊猫数据框中将 SMILES 列转换为 ROMol 列

如何使用 RDkit 或其他将 SMILES 列转换为同一熊猫数据框中的新 SDF(ROMol) 列?

例如:

0 投票
0 回答
199 浏览

python - 使用随机森林进行验证时出现 ValueError

我正在尝试建立一个模型,该模型可以根据其微笑字符串表示来预测分子的 caco-2 系数。我的解决方案是基于这个例子。由于我需要预测实际值,因此我使用RandomForestRegressor. 将一些分子手动添加到代码中,一切正常(尽管预测本身非常错误):

但是,当我尝试Cc1ccc(NNC(=O)c2ccc(CN3C(=O)CCC3=O)cc2)cc1Cl,379.724使用以下代码处理从文件中导入的大量分子时,该文件包含很多看起来像 的行:

它崩溃并出现以下错误:

文件“/home/me/predictor.py”,第 55 行,在 rndf_rgsr.fit(np_fps_train, y_train) 文件“/usr/local/lib/python2.7/dist-packages/sklearn/ensemble/forest.py”中,第 248 行,适合 y = check_array(y, accept_sparse='csc', ensure_2d=False, dtype=None) 文件“/usr/local/lib/python2.7/dist-packages/sklearn/utils/validation.py” ,第 407 行,在 check_array _assert_all_finite(array) 文件“/usr/local/lib/python2.7/dist-packages/sklearn/utils/validation.py”中,第 58 行,在 _assert_all_finite 中“或对于 %r 来说太大的值。” % X.dtype) ValueError: 输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值。

我已经检查过我使用的向量没有包含nans 或infs。这里使用的指纹长度为 2048 位,但我怀疑它们是问题的根源。验证出了点问题,但我真的看不出是什么。你能提供任何提示吗?

ETA:test_db.csv有 50,000 行。我创建了一个tiny_db.csv只有 10 行的模型,在它上面我的模型效果很好(也就是说,它的预测是错误的,但它完全有效)。它也适用于 100 行文件,但对于 1000 行文件则不能,并且会因上述错误而崩溃。进一步的实验表明,250 行有效,但 500 行无效。

ETA:前 250 行有效,但接下来的 250 行(250 到 500)无效。读取超过 100 行时,print(y_train.mean(), y_train.min(), y_train.max())返回(nan,nan,nan). 总而言之,我强烈怀疑问题来自pandas.Dataframe.values,这将我的好系数向上转换为float64,从而导致算术错误,进而导致验证程序崩溃。我认为我最好使用 pythoncsv模块而不是pandas.read_csvDataFrame.values.

0 投票
2 回答
3776 浏览

python-3.x - 安装 RDKit

我已经Spyder3.2.1在我的 Debian v-9.1.0 64 位 Linux 平台上安装了当前版本的 Miniconda3。Spyder 表现良好,但我在安装 RDKit 时遇到了困难。

我按照以下说明进行操作RDKit_Docs_current.pdf

如何RDKit使用 Conda进行安装

使用这些软件包创建一个新的 conda 环境RDKit需要一个类似于以下的命令:

$ conda create -c rdkit -n my-rdkit-env rdkit

最后,必须激活新环境,以便相应的 python 解释器在同一个 shell 中可用:

$ source activate my-rdkit-env

安装过程中没有警告或错误消息,但是当我尝试运行一个简单的 Python 脚本时:

我得到:

RDKit 安装在~/miniconda3/envs/mr-rdkit-env

不幸的是,我不知道问题可能是什么,我们将不胜感激。

提前致谢。

0 投票
0 回答
425 浏览

python - RDKit 构建错误

Rdkit(版本:2013_09_1)make给出了一些错误:

make[2]: [代码/GraphMol/SLNParse/testSLNParse]

[代码/GraphMol/SLNParse/CMakeFiles/testSLNParse.dir/all] 错误2

以前的步骤(Boost 1.54.0,EIGEN3)

--------------------------------------------------升压-------------------------------------------------- -

导出 LD_LIBRARY_PATH="lustre/home/ic003/amakris/boost/boost-home/lib:${LD_LIBRARY_PATH}"

导出 LD_LIBRARY_PATH="/lustre/home/ic003/amakris/boost/boost_1_54_0/bin.v2/libs/python/build/gcc-5.4.0/release/threading-multi/:${LD_LIBRARY_PATH}"


-------------------------------------------------- -- RDKIT ------------------------------------------------------------ ---

导出 RDBASE=/lustre/home/ic003/amakris/rdkit/RDKit_2013_09_1

导出 LD_LIBRARY_PATH=$RDBASE/lib:$LD_LIBRARY_PATH

导出 PYTHONPATH=$RDBASE:$PYTHONPATH

在 CMakeLists.txt 我添加了:

为了确保使用正确的 boost 版本(而不是系统默认的 1.64)。

cmake /lustre/home/ic003/amakris/rdkit/RDKit_2013_09_1/ > -DBOOST_ROOT=/lustre/home/ic003/amakris/boost/boost-home -DBoost_NO_SYSTEM_PATHS=ON -DBoost_USE_STATIC_LIBS=OFF -DRDK_BUILD_INCHI_SUPPORT=ON -DEIGEN3_INCLUDE_DIR=/lustre/ home/ic003/amakris/.local/include/eigen3 -DAVALONTOOLS_DIR=$RDBASE/External/AvalonTools/distrib/SourceDistribution -DRDK_BUILD_AVALON_SUPPORT=ON

cmake结果:

-- 检查系统是否为大端

-- 搜索 16 位整数

-- 寻找 sys/types.h

-- 寻找 sys/types.h - 找到

-- 寻找 stdint.h

-- 寻找 stdint.h - 找到

-- 寻找 stddef.h

-- 寻找 stddef.h - 找到

-- 检查 unsigned short 的大小

-- 检查无符号短完成的大小

-- 使用无符号短

-- 检查系统是否为大端 - 小端

-- 找到 PythonLibs: /usr/lib64/libpython2.7.so (找到版本 "2.7.5")
-- 找到 PythonInterp: /usr/bin/python (找到版本 "2.7.5")

-- 增强版:1.54.0

-- 找到以下 Boost 库:

- Python

-- 寻找包含文件 pthread.h

-- 寻找包含文件 pthread.h - 找到

-- 寻找 pthread_create

-- 寻找 pthread_create - 未找到

-- 在 pthreads 中寻找 pthread_create

-- 在 pthreads 中寻找 pthread_create - 未找到

-- 在 pthread 中寻找 pthread_create

-- 在 pthread 中寻找 pthread_create - 找到

-- 找到的线程:TRUE

-- 在系统位置找不到 InChI(缺少:INCHI_LIBRARY INCHI_INCLUDE_DIR)

-- 在本地找到 InChI 软件

-- 找到 BISON:/usr/bin/bison

-- 找到 FLEX:/usr/bin/flex

-- 增强版:1.54.0

-- 找到以下 Boost 库:

-- 正则表达式

-- 配置完成

-- 生成完成

当我尝试使用 ( make -j 4) 进行制作时,出现以下错误:

../../../lib/libSLNParse.so.1.2013.09.1:未定义对boost::match_results<__gnu_cxx::__normal_iterator<char const*, std::string>, std::allocator<boost::sub_match<__gnu_cxx::__normal_iterator<char const*, std::string> > > >::maybe_assign(boost::match_results<__gnu_cxx::__normal_iterator<char const*, std::string>, std::allocator<boost::sub_match<__gnu_cxx::__normal_iterator<char const*, std::string> > > > const&)' ../../../lib/libSLNParse.so.1.2013.09.1: undefined reference toboost::re_detail::perl_matcher<__gnu_cxx::__normal_iterator, std::allocator > >, boost::regex_traits >:: 的引用constructor_init(boost::basic_regex > > const&, boost::regex_constants::_match_flags)' collect2: 错误: ld 返回 1 退出状态 make[2]: [Code/GraphMol/SLNParse/testSLNParse] 错误 1 ​​make[1]: [代码/GraphMol/SLNParse/CMakeFiles/testSLNParse.dir/all] 错误 2

我知道如果我添加 cmake -DRDK_BUILD_SLN_SUPPORT=OFF构建成功。但我需要 SLN SUPPORT 所以我不使用它。

有谁知道出了什么问题?(我想要上述软件包的这些版本,而且我没有 sudo 权限)。

先感谢您。