0

我是整个搜索的新手,很难学习干草堆。(solr 作为后端)

这是我对 haystack/solr 的理解。
如果我的理解有误,请评论。

Solr
solr 是文档搜索引擎。(与 RDBMS 相对)
它允许用户快速搜索给定术语的文档。(可以使用倒排索引)
solr 还允许在文档结构良好的情况下进行分面搜索。(如在 xml 中)

Haystack
对于某些应用程序(例如电子商务网站),将产品数据存储在 RDBMS 中是个好主意。(好吧,xml 也可以工作,但我只是猜测 RDBMS 比 xml 更擅长更新)
如果我们存储产品数据在 RDBMS 中,我们可以编写查询来获取用户查询的相关数据,但这很麻烦。
Haystack 可以将 RDBMS 中的数据转换为文档,以便 solr 可以对其进行索引。solr 索引数据后,大部分搜索可以委托给 solr。

问题来了。

  1. 我可以根据需要创建数据库模式并仍然使用 haystack/solr 吗?

  2. 假设我有如下数据库模型,我的 search_indexes.py 会是什么样子来启用任何类别的分面搜索?

...

class Category(models.Model):   
    name = models.CharField(max_length=200)  
    parentCategory = models.ForeignKey('self', null=True, blank=True)

class Item(models.Model):   
    name = models.CharField(max_length=200)  
    categorys = models.ManyToManyField(Category)  
    details = models.CharField(max_length=1024)

注意,类别可以嵌套(类别可以有一个父类别)。

4

1 回答 1

1

正如其简介所说,Haystack用于 Django 的模块化搜索。它专注于简化构建站点搜索和维护索引的方式,并且做得很好。将它与通用 Django ORM 进行比较是没有意义的,尽管它们的搜索功能在一定程度上重叠。
对于您的模型,由于 Item() 属于多个类别,您可以尝试FacetMultiValueField

# in models.py
class Category(models.Model):
    # add __unicode__ method
    def __unicode__(self):
        return self.name

# in search_indexes.py
from haystack.indexes import *
class ItemIndex(SearchIndex):
    text = CharField(document=True, use_template=True)
    name = CharField(model_attr='name')
    categories = FacetMultiValueField() # or MultiValueField w/ facet=True

    def prepare_categories(self, obj):
        return obj.categories.all()

并按照http://django-haystack.readthedocs.org/en/latest/faceting.html在视图中操作SearchQuerySet。

于 2012-04-16T13:06:57.400 回答