0

我是 solr 的新手,我对 delta-imports 有一个非常基本的问题。我的 mySQL DB 中有几条新记录。因此,当我在第二个 x 开始导入时,很有可能在开始导入后的同一秒内我会在数据库中获得一些新记录,但是下次我开始 delta-import 时,它会检查“ dataimport.properties 中的 last_index_time" 并将导入第二个 x 之后更改的所有记录。因此,在开始最后一次导入后,我将丢失在第二个 x 中已更改的所有记录。如果我是对的,即使可以将时间戳从秒更改为毫秒,这也是同样的问题。时间窗口会更小,丢失的记录数量会更小,但问题本身仍然存在。

我在教程或其他任何地方都没有发现任何关于这个问题的提及。我是第一个每秒处理几条记录的人,还是我错过了其他东西?

提前谢谢了!

4

1 回答 1

0

如果要处理精确的秒,您只需检查等于或大于上次修改时间的记录。
无论如何,如果记录已经存在(由唯一键标识),它将被覆盖。Solr 默认会更新记录,因此不会创建重复项。

于 2013-09-02T12:36:37.973 回答