3

我是 Solr 的新手,我正在努力导入一些不包含 ID 字段的 XML 数据,尽管它说我的 schema.xml 是必需的:

一个 XML 示例:

<results>
<estacions>
<estacio id="72400" nom="Aeroport"/>
<estacio id="79600" nom="Arenys de Mar"/>
...
</estacions>
</results>

架构.xml:

<uniqueKey>id</uniqueKey>

此时,我需要从 http fetch 中导入这个 xml,然后我使用 DataimportHandler。这是我的 data-config.xml

<dataConfig>
    <dataSource type="URLDataSource" />
    <document>
            <entity name="renfe"                        
                    url="http://host_url/myexample.xml"
                    processor="XPathEntityProcessor"
                    forEach="/results/estacions/estacio"
                    transformer="script:generateCustomId">
                    <field column="idestacio"   xpath="/results/estacions/estacio/@id" commonField="true" />
                    <field column="nomestacio"  xpath="/results/estacions/estacio/@nom" commonField="true" />
            </entity>
    </document>

然后,它似乎工作正常,但我收到以下错误:org.apache.solr.common.SolrException: [doc=null] missing required field: id

这让我认为我应该在导入时生成一个自动 ID,并使用 data-config.xml,但我不知道如何去做。

我应该怎么做?使用 ScriptTransformer?任何想法不胜感激

还有一个问题:我可以在导入期间强制一个值吗?

例如:(<field column="site" value="estacions"/>显然这不起作用)

4

1 回答 1

7

您可以使用以下代码生成 ID:

<dataConfig>
  <script><![CDATA[
        id = 1;
        function GenerateId(row) {
            row.put('id', (id ++).toFixed());
            return row;
        }
       ]]></script>
    <dataSource type="URLDataSource" />
    <document>
            <entity name="renfe"                        
                    url="http://host_url/myexample.xml"
                    processor="XPathEntityProcessor"
                    forEach="/results/estacions/estacio"
                    transformer="script:GenerateId">
                    <field column="idestacio"   xpath="/results/estacions/estacio/@id" commonField="true" />
                    <field column="nomestacio"  xpath="/results/estacions/estacio/@nom" commonField="true" />
            </entity>
    </document>
于 2012-04-30T10:09:29.563 回答