hadoop - Hadoop生态系统中的实时数据库

翻译自：https://stackoverflow.com/questions/25721803 2014-09-08T10:07:04.947

95 次

如果这是一个愚蠢的问题，请原谅我。

我在单个节点中安装了一个 cloudera 管理器。

我正在尝试使用 Hbase 和 Hadoop 在我的 Web 应用程序中记录请求和响应。

我正在尝试使用日志列出最新的用户活动。

使用下表结构添加行。

1 列族，RowId，11 列。我将每个值存储为字符串。相当简单且类似于 mysql 表。

RowId
entry:addedTime
entry:value
entry:ip
entry:accessToken
entry:identifier
entry:userId
entry:productId
entry:object
entry:requestHeader
entry:completeDate
entry:tag

现在，为了从我的 Hbase 中获取行，我使用

SingleColumnValueFilter("entry", "userId", "=", binary:"25", true, true)

现在，我正在努力订购这个

entry:completeDate DESCENDING

分页或无限滚动限制为 25 行。

我的问题，

Hbase 是 Hadoop 生态系统中唯一可用的实时查询数据库吗？

我是否出于错误的原因使用 Hbase？我的表结构是否正确？

我在一家初创公司工作，这些是我们转向大数据的初步步骤。尽管 BigData 引起了很多炒作，但 Hadoop 对最新的 linux 的支持很差，而且看起来太复杂了。

任何帮助或建议将不胜感激。

非常感谢，

卡尔提克

hadoop - Hadoop生态系统中的实时数据库

0 回答 0

Related

Reference