我想知道是否有人曾经尝试将membase的(或者我现在应该说couchbase的?)TAP输出协议链接到sphinx(开源全文搜索引擎)。
你是怎么做到的?效果如何?网上任何好的参考资料(我似乎找不到任何参考资料)
谢谢!
问候, ldx
我以前从未真正这样做过,但看起来 sphinx 有一个 xml 管道机制。他们把它放在适当的位置,这样人们就不必自己编写新的数据源驱动程序。
有关 xmlpipe 的更多信息:http: //sphinxsearch.com/docs/2.0.1/xmlpipe.html
您可以做的是获取其中一个 java tap 实现。一个只是一个自来水项目。
https://github.com/mikewied/jtap
另一个是 spymemcached 的最新版本(目前是带有 Tap 支持的预发布版本)
您可以在此处的 Couchbase 网站上找到它:
http://files.couchbase.com/maven2/spy/spymemcached/2.7/
我会使用 spymemcached 一个,因为它跟踪拓扑变化,并且使用 jtap 您必须为每个节点启动一个单独的分流流。两者都非常相似。
最好的办法可能是启动一个点击流,然后创建小的 xml 片段,就像我在上面链接到的 sphinx 页面上的示例中一样。然后您可以将 xml 发送到 sphinx 管道进行索引。
此外,如果您对 Tap 客户端有任何问题,只需发布到 Couchbase 论坛即可。他们回答问题的速度非常快。