1

字段元素的数量对索引/搜索性能有什么影响?

我们有以下文档结构,其中一些文档具有多达 400 个字段元素。我们已经看到 solr 服务器 CPU 使用率上升,并没有将问题与元素数量的增加隔离开来,但想知道是否有人这样做any analysis on the Solr performance vs # of field elements.

我们使用单个 Solr 服务器进行索引和读取,并启用了自动提交。

<add>
    <doc>
        <field name="id">User 4990</field>
        <field name="type">User</field>
        <field name="type">ActiveRecord::Base</field>
        <field name="class_name">User</field>
        <field name="id_i">4990</field>
        <field name="login_s">someuser</field>
        <field name="first_name_s">some</field>
        <field name="last_name_s">user</field>
        <field name="email_s">someuser@somecompany.com</field>
        <field name="department_s">department-psg</field>
        <field name="activated_b">true</field>
        <field name="private_profile_b">false</field>
        <field name="deleted_b">false</field>
        <field name="followers_im">4834</field>
        <field name="followers_im">4965</field>
        <field name="followers_im">3</field>
        <field name="followers_im">4291</field>

        ...
        ...
        ..
        <field
            ..
        <**400** such fields

    ..
    </doc>
</add>

Solr 版本:3.6.1,Cent OS 5.6 上的 Java 6

4

1 回答 1

1

这取决于您是否搜索所有字段以及您使用的运算符、存储在字段中的数据大小、字段在架构中的定义方式以及您是仅搜索字段还是从中检索数据以显示.

一般来说,搜索速度非常快,在我的模式中,我有大约 100 个字段。但是,存在效率低下的查询会减慢速度。有关更多详细信息,请参阅solr 性能 wiki

根据我自己的经验,我可以告诉您,突出显示受您突出显示的字段数量的强烈影响,因为它会在每个结果文档的每个字段上运行,即大量字段在实践中会给您带来二次复杂性。

于 2012-08-16T12:43:22.177 回答