我需要编写一个存储大量结构化和非结构化数据的系统。我的查询将查找文本以及二进制信息。
我正在寻找适合这些要求的解决方案。我遇到了 Splunk,它似乎非常用户友好并且提供了一个不错的 API。但是,它似乎非常面向日志,并且似乎只支持文本搜索(无二进制)。我的数据不是日志,它只是我需要搜索的大量原始文本/二进制数据......
所以我的问题是:
- Splunk 可以很好地解决我的问题吗?有没有办法进行二进制搜索?
- 也许有更好的解决方案?也许是 Hadoop(我又读了一点,我不确定这是否是我正在寻找的)?
谢谢!