如果这是一个愚蠢的问题,请原谅我。
我在单个节点中安装了一个 cloudera 管理器。
我正在尝试使用 Hbase 和 Hadoop 在我的 Web 应用程序中记录请求和响应。
我正在尝试使用日志列出最新的用户活动。
使用下表结构添加行。
1 列族,RowId,11 列。我将每个值存储为字符串。相当简单且类似于 mysql 表。
RowId
entry:addedTime
entry:value
entry:ip
entry:accessToken
entry:identifier
entry:userId
entry:productId
entry:object
entry:requestHeader
entry:completeDate
entry:tag
现在,为了从我的 Hbase 中获取行,我使用
SingleColumnValueFilter("entry", "userId", "=", binary:"25", true, true)
现在,我正在努力订购这个
entry:completeDate DESCENDING
分页或无限滚动限制为 25 行。
我的问题,
Hbase 是 Hadoop 生态系统中唯一可用的实时查询数据库吗?
我是否出于错误的原因使用 Hbase?我的表结构是否正确?
我在一家初创公司工作,这些是我们转向大数据的初步步骤。尽管 BigData 引起了很多炒作,但 Hadoop 对最新的 linux 的支持很差,而且看起来太复杂了。
任何帮助或建议将不胜感激。
非常感谢,
卡尔提克