0

目前我有一个应用程序,用户可以在其中上传文档(pdfs/excel/word,少量图片)。在哪里可以寻找大数据(Hadoop-MangoDB)解决方案

  1. 存储数千个 pdf、word、excel 文件(因为我们的大小也在增长)

  2. 搜索图像元信息

  3. 全文搜索(大部分是实时的)

  4. 更快的检索

请指教

4

1 回答 1

0

看看 apache Hbase 也..你可能会发现它对你的用例很有用..它是一个运行在 Hdfs 之上并提供随机实时读/写访问的 NOSQL 数据库..你可以看看 Apache Hive好吧..虽然它不像 Hbase 那样用于实时处理,但它在 Hadoop 集群之上提供了一个具有类似 SQL 接口的数据仓库..您可以在后台运行 Hive 作业,如果您知道提前进行处理..如果您来自 SQL 背景,这将很有用。

于 2012-06-12T20:46:38.727 回答