0

我正在尝试使用为每种化合物预先计算的 Avalon 指纹对化学数据库执行子结构搜索。在 RDKit 中有一种方法可以比较这些指纹:

DataStructs.AllProbeBitsMatch ( fp1, fp2 )

文档这样描述此方法:“如果第一个参数中的所有位与第二个参数中的泡菜定义的向量中的所有位匹配,则返回 True”。

他们谈论位向量,但这个指纹也可以“作为单词”计算(整数数组,通过 RDKit 中的 GetAvalonFPAsWords 方法,我可以将其存储在 MongoDB 中,并希望在没有 RDKit 的情况下执行搜索,只使用数据库的功能(必须快得多)。

所以这是我的问题:我需要对数组进行某种操作,这相当于位向量的 AllProbeBitsMatch。理想情况下,此操作应在 MongoDB 上完成,可能使用聚合功能以获得更好的性能。

这是一篇关于 RDKit 和 Avalon 指纹的文章,供我参考:http ://rdkit.blogspot.com/2013/11/fingerprint-based-substructure.html

4

0 回答 0