1

我们在 PostgreSQL 数据库中有“文章”表,其结构如下(简化):

CREATE TABLE article
(
  id integer,
  header text,
  body text,
  isSolrized boolean
)

我想定期将所有非 solrized 行导入 solr4。

是否有工具或内置 solr 的机制来执行此操作?

我将使用 blackjack 和 hookers实现我自己的导入工具,并使用 cron 运行它。有没有更好的办法?

4

2 回答 2

3

选择了 DataImportHandler。

  1. 下载 postgresql 的 jdbc 驱动并放在 dist/ 目录下

  2. 将模块添加到配置文件:

    <lib dir="../../dist/" regex="apache-solr-dataimporthandler-\d.*\.jar" />
    <lib dir="../../dist/" regex="postgresql-\d.*\.jar" />
    
  3. 按照Solr wiki上的说明进行操作

  4. 记得在scheme.xml中声明你的方案

30分钟内完成。

于 2013-01-13T20:33:00.983 回答
1

在 PostgeSQL 中实现一个外部数据包装器(这里有详细信息和示例)可能会更好。它可以包含您想要的任何逻辑。

实现后,可以在简单的触发器中使用,也可以用cron(或PostgreSQL自己的planner)调用。

如果你开源,这样的东西可能对其他人有用。

于 2013-01-13T16:26:29.357 回答