0

如果这是一个愚蠢的问题,请原谅我。

我在单个节点中安装了一个 cloudera 管理器。

我正在尝试使用 Hbase 和 Hadoop 在我的 Web 应用程序中记录请求和响应。

我正在尝试使用日志列出最新的用户活动。

使用下表结构添加行。

1 列族,RowId,11 列。我将每个值存储为字符串。相当简单且类似于 mysql 表。

RowId
entry:addedTime
entry:value
entry:ip
entry:accessToken
entry:identifier
entry:userId
entry:productId
entry:object
entry:requestHeader
entry:completeDate
entry:tag

现在,为了从我的 Hbase 中获取行,我使用

SingleColumnValueFilter("entry", "userId", "=", binary:"25", true, true)

现在,我正在努力订购这个

entry:completeDate DESCENDING

分页或无限滚动限制为 25 行。

我的问题,

Hbase 是 Hadoop 生态系统中唯一可用的实时查询数据库吗?

我是否出于错误的原因使用 Hbase?我的表结构是否正确?

我在一家初创公司工作,这些是我们转向大数据的初步步骤。尽管 BigData 引起了很多炒作,但 Hadoop 对最新的 linux 的支持很差,而且看起来太复杂了。

任何帮助或建议将不胜感激。

非常感谢,

卡尔提克

4

0 回答 0