问题标签 [rdkit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
django - rdikit安装和导入错误
导入 rdkit 时出现此错误。Traceback(最近一次调用
我已将我的 .bashrc 文件编辑为此
同样在 PyCharm 中编辑了设置以添加带有 RDkit 位置的内容根,并将 ENV 变量设置为指向 RDkit lib 位置。我仍然有同样的错误。
是否还有其他我忽略的配置过程。谢谢
python - 将数组转换为 Numpy 数组更改值
我正在使用 RDKit 包将一些 SMILES 转换为指纹。
我的问题,我使用 Scikit learn,我想做一份简历。对于 CV,我需要 np.array 数据结构...对于指纹类型,我将数据结构转换为 0 和 1 的结构。这里只是一个任意的例子
print x: 一个 vektor 包含很多:rdkit.DataStructs.cDataStructs.ExplicitBitVect object at 0x05E498F0 objects will be createt
x=np.array(x) print x:将创建一个由 1 和 0 组成的向量。
我不知道为什么 numpy 数组转换,改变类型?
对于 0x05DDF960 处的 rdkit.DataStructs.cDataStructs.LongSparseIntVect 对象之类的对象,numpy 将向量更改为相同的结构。
我只是问,因为从 4 个指纹中的 2 个,由于 numpy 转换,我得到了这个错误:
AttributeError:“numpy.ndarray”对象没有指纹摩根的属性“GetNumBits”
Drücken Sie eine beliebige 味道。. . 打印帧率
python - 如何在 PyCharm 中将 RDKit 添加到项目中?
所以,我正在尝试将 RDKit 添加到我在 PyCharm 中的项目中。我发现如果你使用解释器/usr/bin/python2.7
PyCharm 会尝试使用pip
. 同时,RDKit 需要conda
. 我试图将解释器更改为conda
,但RDKit
不在列表中,或者无法打开带有 repo 的 URL。有谁知道如何解决这个问题?
顺便说一句,在安装东西的同时,是否有可能让解释器/usr/bin/python2.7
使用其他任何东西(不是pip
)?
r - Rrdkit - 使用 install_github/devtools/timeout 问题时出错
系统: Linux - CentOS 6.5
R 版本: 3.2.3(64 位)
我在这里暴露了同样的错误:
我测试了 maddy2u 的解决方案,但它在我的工作站上无法使用options(download.file.method = "wget")
or options(download.file.method = "libcurl")
。我尝试了很多东西,但我没有解决这个问题的想法。
欢迎任何帮助,并提前致谢。
python - Anaconda 的 rdkit 安装问题
我正在尝试使用 Anaconda 和 Python 2.7 让 rdkit 在我的 Windows 7 系统上运行。我一直按照http://www.rdkit.org/docs/Install.html的说明进行操作
然后我得到以下信息:
停用环境“C:\Anaconda2”...
激活环境“C:\Anaconda2\envs\my-rdkit-env”
但是,如果我随后打开一个 Jupyter 笔记本,并尝试
它失败了
ImportError:没有名为 rdkit 的模块
任何帮助将不胜感激!
python - 为化学指纹选择 n 个簇
您好,我正在尝试对化学指纹进行聚类
我正在使用为集群提供分层方法的 rdkit,问题是我知道我想要拥有 13 个集群的集群数量,所以我使用基于 scikit 的 tanimoto 相似度得分的 kmean 方法
这是我的代码:
聚类似乎以某种方式起作用,但我不知道我们如何对化学指纹进行聚类,我们是否应该将聚类算法直接应用于指纹本身?
python - 在同一熊猫数据框中将 SMILES 列转换为 ROMol 列
如何使用 RDkit 或其他将 SMILES 列转换为同一熊猫数据框中的新 SDF(ROMol) 列?
例如:
python - 使用随机森林进行验证时出现 ValueError
我正在尝试建立一个模型,该模型可以根据其微笑字符串表示来预测分子的 caco-2 系数。我的解决方案是基于这个例子。由于我需要预测实际值,因此我使用RandomForestRegressor
. 将一些分子手动添加到代码中,一切正常(尽管预测本身非常错误):
但是,当我尝试Cc1ccc(NNC(=O)c2ccc(CN3C(=O)CCC3=O)cc2)cc1Cl,379.724
使用以下代码处理从文件中导入的大量分子时,该文件包含很多看起来像 的行:
它崩溃并出现以下错误:
文件“/home/me/predictor.py”,第 55 行,在 rndf_rgsr.fit(np_fps_train, y_train) 文件“/usr/local/lib/python2.7/dist-packages/sklearn/ensemble/forest.py”中,第 248 行,适合 y = check_array(y, accept_sparse='csc', ensure_2d=False, dtype=None) 文件“/usr/local/lib/python2.7/dist-packages/sklearn/utils/validation.py” ,第 407 行,在 check_array _assert_all_finite(array) 文件“/usr/local/lib/python2.7/dist-packages/sklearn/utils/validation.py”中,第 58 行,在 _assert_all_finite 中“或对于 %r 来说太大的值。” % X.dtype) ValueError: 输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值。
我已经检查过我使用的向量没有包含nan
s 或inf
s。这里使用的指纹长度为 2048 位,但我怀疑它们是问题的根源。验证出了点问题,但我真的看不出是什么。你能提供任何提示吗?
ETA:test_db.csv
有 50,000 行。我创建了一个tiny_db.csv
只有 10 行的模型,在它上面我的模型效果很好(也就是说,它的预测是错误的,但它完全有效)。它也适用于 100 行文件,但对于 1000 行文件则不能,并且会因上述错误而崩溃。进一步的实验表明,250 行有效,但 500 行无效。
ETA:前 250 行有效,但接下来的 250 行(250 到 500)无效。读取超过 100 行时,print(y_train.mean(), y_train.min(), y_train.max())
返回(nan,nan,nan)
. 总而言之,我强烈怀疑问题来自pandas.Dataframe.values
,这将我的好系数向上转换为float64
,从而导致算术错误,进而导致验证程序崩溃。我认为我最好使用 pythoncsv
模块而不是pandas.read_csv
与DataFrame.values
.
python-3.x - 安装 RDKit
我已经Spyder3.2.1
在我的 Debian v-9.1.0 64 位 Linux 平台上安装了当前版本的 Miniconda3。Spyder 表现良好,但我在安装 RDKit 时遇到了困难。
我按照以下说明进行操作RDKit_Docs_current.pdf
:
如何
RDKit
使用 Conda进行安装使用这些软件包创建一个新的 conda 环境
RDKit
需要一个类似于以下的命令:
$ conda create -c rdkit -n my-rdkit-env rdkit
最后,必须激活新环境,以便相应的 python 解释器在同一个 shell 中可用:
$ source activate my-rdkit-env
安装过程中没有警告或错误消息,但是当我尝试运行一个简单的 Python 脚本时:
我得到:
RDKit 安装在~/miniconda3/envs/mr-rdkit-env
不幸的是,我不知道问题可能是什么,我们将不胜感激。
提前致谢。
python - RDKit 构建错误
Rdkit(版本:2013_09_1)make
给出了一些错误:
make[2]: [代码/GraphMol/SLNParse/testSLNParse]
[代码/GraphMol/SLNParse/CMakeFiles/testSLNParse.dir/all] 错误2
以前的步骤(Boost 1.54.0,EIGEN3)
--------------------------------------------------升压-------------------------------------------------- -
导出 LD_LIBRARY_PATH="lustre/home/ic003/amakris/boost/boost-home/lib:${LD_LIBRARY_PATH}"
导出 LD_LIBRARY_PATH="/lustre/home/ic003/amakris/boost/boost_1_54_0/bin.v2/libs/python/build/gcc-5.4.0/release/threading-multi/:${LD_LIBRARY_PATH}"
-------------------------------------------------- -- RDKIT ------------------------------------------------------------ ---
导出 RDBASE=/lustre/home/ic003/amakris/rdkit/RDKit_2013_09_1
导出 LD_LIBRARY_PATH=$RDBASE/lib:$LD_LIBRARY_PATH
导出 PYTHONPATH=$RDBASE:$PYTHONPATH
在 CMakeLists.txt 我添加了:
为了确保使用正确的 boost 版本(而不是系统默认的 1.64)。
cmake /lustre/home/ic003/amakris/rdkit/RDKit_2013_09_1/ > -DBOOST_ROOT=/lustre/home/ic003/amakris/boost/boost-home -DBoost_NO_SYSTEM_PATHS=ON -DBoost_USE_STATIC_LIBS=OFF -DRDK_BUILD_INCHI_SUPPORT=ON -DEIGEN3_INCLUDE_DIR=/lustre/ home/ic003/amakris/.local/include/eigen3 -DAVALONTOOLS_DIR=$RDBASE/External/AvalonTools/distrib/SourceDistribution -DRDK_BUILD_AVALON_SUPPORT=ON
cmake结果:
-- 检查系统是否为大端
-- 搜索 16 位整数
-- 寻找 sys/types.h
-- 寻找 sys/types.h - 找到
-- 寻找 stdint.h
-- 寻找 stdint.h - 找到
-- 寻找 stddef.h
-- 寻找 stddef.h - 找到
-- 检查 unsigned short 的大小
-- 检查无符号短完成的大小
-- 使用无符号短
-- 检查系统是否为大端 - 小端
-- 找到 PythonLibs: /usr/lib64/libpython2.7.so (找到版本 "2.7.5")
-- 找到 PythonInterp: /usr/bin/python (找到版本 "2.7.5")-- 增强版:1.54.0
-- 找到以下 Boost 库:
- Python
-- 寻找包含文件 pthread.h
-- 寻找包含文件 pthread.h - 找到
-- 寻找 pthread_create
-- 寻找 pthread_create - 未找到
-- 在 pthreads 中寻找 pthread_create
-- 在 pthreads 中寻找 pthread_create - 未找到
-- 在 pthread 中寻找 pthread_create
-- 在 pthread 中寻找 pthread_create - 找到
-- 找到的线程:TRUE
-- 在系统位置找不到 InChI(缺少:INCHI_LIBRARY INCHI_INCLUDE_DIR)
-- 在本地找到 InChI 软件
-- 找到 BISON:/usr/bin/bison
-- 找到 FLEX:/usr/bin/flex
-- 增强版:1.54.0
-- 找到以下 Boost 库:
-- 正则表达式
-- 配置完成
-- 生成完成
当我尝试使用 ( make -j 4
) 进行制作时,出现以下错误:
../../../lib/libSLNParse.so.1.2013.09.1:未定义对boost::match_results<__gnu_cxx::__normal_iterator<char const*, std::string>, std::allocator<boost::sub_match<__gnu_cxx::__normal_iterator<char const*, std::string> > > >::maybe_assign(boost::match_results<__gnu_cxx::__normal_iterator<char const*, std::string>, std::allocator<boost::sub_match<__gnu_cxx::__normal_iterator<char const*, std::string> > > > const&)'
../../../lib/libSLNParse.so.1.2013.09.1: undefined reference to
boost::re_detail::perl_matcher<__gnu_cxx::__normal_iterator, std::allocator > >, boost::regex_traits >:: 的引用constructor_init(boost::basic_regex > > const&, boost::regex_constants::_match_flags)' collect2: 错误: ld 返回 1 退出状态 make[2]: [Code/GraphMol/SLNParse/testSLNParse] 错误 1 make[1]: [代码/GraphMol/SLNParse/CMakeFiles/testSLNParse.dir/all] 错误 2
我知道如果我添加 cmake -DRDK_BUILD_SLN_SUPPORT=OFF构建成功。但我需要 SLN SUPPORT 所以我不使用它。
有谁知道出了什么问题?(我想要上述软件包的这些版本,而且我没有 sudo 权限)。
先感谢您。