2

我无法让 django 自动索引新创建的对象。

我曾经groupby创建一些自定义数据。

每次创建新模型时,都应该对其进行索引。

确实索引“title”值,但“tag”值不存在。

所以,我创建了一个手动函数“manual_index”。当我运行它时,“标签”值确实被添加到索引中。然而,这个过程必须手动触发。

每次创建新对象时,如何获取要保存的“标签”值?

我正在使用 elasticsearch_dsl

搜索.py

class TaskIndex(DocType):
    title = String()
    class Meta:
        index = 'task-index'

def manual_index():
    TaskIndex.init()
    es = Elasticsearch()
    bulk(client=es, actions=(b.indexing() for b in models.Task.objects.all().iterator()))

模型.py

from itertools import groupby

class Tag(models.Model):
    name = models.CharField("Name", max_length=5000, blank=True)
    taglevel = models.IntegerField("Tag level", null=True, blank=True)

class Item(models.Model):
    title = models.CharField("Title", max_length=10000, blank=True)
    tag = models.ManyToManyField('Tag', blank=True)

    def get_grouped_tags(self):
        tag = self.tag.order_by('taglevel')
        grouped_tags = {
            tag_level: [
                { 'name': tag_of_level.name, 'taglevel': tag_of_level.taglevel, }
                for tag_of_level in tags_of_level
            ] for tag_level, tags_of_level
            in groupby(tag, lambda tag: tag.taglevel)
        }
        return grouped_tags

    def indexing(self):
        obj = TaskIndex(
            meta={'id': self.id},
            title=self.title,
            tag=self.get_grouped_tags()
        obj.save()
        return obj.to_dict(include_meta=True)
4

1 回答 1

0

这里有几个问题,首先您将所有内容保存两次-一次在内部indexing(通过调用.save()),然后在manual_index.

中的代码manual_index效率更高,并且绝对应该用于重新索引整个数据集。对于单独的模型创建,您indexing几乎可以按原样使用该方法并使用 django 的signal框架。只需修改indexing方法以返回TaskIndex对象(不调用.save()它!)并将以下代码的等效代码添加到您的models.pyhttps://github.com/HonzaKral/es-django-example/blob/master/qa/models。 py#L128-L137

在您的代码中,您将只使用indexing而不是我的to_search

希望这会有所帮助, Honza

于 2017-02-10T15:33:38.200 回答