当我想在我的程序中使用bloomfilter时,它会有一些误报率。我不知道如何为这些会误判的词创建一个白名单?谁能给我一些指示?
问问题
346 次
1 回答
2
如果您可以限制可能对布隆过滤器进行的查询的空间,您可以在您的条目被散列到布隆过滤器后创建这样一个列表。这个想法是,如果您事先知道所有可能的查询,并且该集合的大小相当小,您可以进行所有这些查询并将所有误报的“是”答案与 Bloom Filter 一起保存,以便知道避免他们在你的跑步过程中。最近的一篇生物信息学文章正是这样做的:http: //minia.genouest.org/files/minia.pdf。
当然,这取决于利用散列对象的某些属性。在链接到的情况下,它知道条目是重叠的 DNA k-mers,因此它们的扩展在每一端只能具有 4 个可能值之一。
于 2013-11-29T06:09:28.373 回答