问题标签 [hbase]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hbase - 在 hbase 上快速查询
我在这里运行一个小测试/ poc。
我需要每天将几百万行加载到数据库中。而且它不是日志文件数据,我有逗号分隔的行(列),它完全适合关系数据库。
加载后,我需要允许一个非常快速的搜索机制。稍微看了一下google对bigtable的实现以及围绕它的结构,我原本是想用hive和hbase集成的。Hive 因为它的查询能力。加载效果很好,比 RDBMS 性能更好。但是,查询瓶颈(最初是寻找 RDBMS 替代品的原因)也继续存在于 hive 中。
测试 hive 以进行查询并不是真正的出色性能。也许我需要寻找替代品..
还有别的吗?我可以放在 hbase 之上的任何其他工具/解决方案/库吗?甚至没有 hbase ?(我将 hbase 视为 RDBMS 的替代品,转向 dist 计算)
建议请...
couchdb - CouchDB 与 HBase
这两者之间有什么相似之处吗?
hbase - 有没有办法回滚hbase
有没有办法在单元格级别将值回滚到前一阶段(行级别也可能有效)
我导入了一个包含错误数据的文件,我只需要返回上一阶段。
java - 摆脱 Hbase 配置已弃用警告
我在我的日志文件中收到此错误消息,我WARN hbase.HBaseConfiguration: instantiating HBaseConfiguration() is deprecated. Please use HBaseConfiguration#create() to construct a plain Configuration
该如何摆脱它?
我的类扩展了 Configured.class ,我正在实例化这样的配置:
有没有人有类似的问题?如何解决?
编辑
如何获得此版本的 HbaseConfiguration :
http://hbase.apache.org/docs/r0.89.20100726/xref/org/apache/hadoop/hbase/HBaseConfiguration.html
我从 hbase 网站下载了最新版本(版本 0.20.6),但是这个类与这个不同,它缺少 create() 方法和其他一些方法。
php - 我应该使用文档数据库重建我的 PHP 网站以提高性能吗?
我们有一个用 PHP 和 MySQL 开发的网站,有时会在流量增加时遇到问题。我们几乎以各种方式优化了网站以处理更多请求,但在高峰时段仍然面临问题。
我的一位朋友建议使用 HBase / MongoDB 作为后端来重建站点以提高性能。他还建议,如果我们重建它,我们可以轻松迁移到云服务。但是我们需要学习整个事物并重新开发它。
这样做更好吗?
command-line - 一个删除Hbase中所有表的脚本
我可以使用以下命令告诉 hbase 禁用和删除特定表:
但我想删除数据库中的所有表,而不对任何表的名称进行硬编码。有没有办法做到这一点?我想通过命令行实用程序来执行此操作./hbase shell
,而不是通过 Java 或 Thrift。
serialization - 如何将复杂对象存储到hadoop Hbase中?
我有需要存储到 Hadoop 的带有集合字段的复杂对象。我不想遍历整个对象树并明确存储每个字段。所以我只考虑复杂字段的序列化并将其存储为一大块。而不是在阅读对象时对其进行反序列化。那么最好的方法是什么?我虽然想为此使用某种序列化,但我希望 Hadoop 有办法处理这种情况。
要存储的示例对象的类:
hadoop - 使用 HBase 存储时间序列数据
我们正在尝试使用HBase来存储时间序列数据。我们当前拥有的模型将时间序列作为版本存储在一个单元格中。这意味着单元格最终可能存储数百万个版本,并且此时间序列上的查询将使用HBase中 Get 类上可用的 setTimeRange 方法检索一系列版本。
例如
这是在 HBase 中存储时间序列数据的合理模型吗?
将数据存储在多列(是否可以跨列查询)或行中的替代模型是否更合适?
java - 面向行和面向列的数据库在处理信息检索方面的区别
最近,我开始研究 HBase(面向列的数据库之一)。在浏览源代码时,一个问题一直在我脑海中浮现。想问这个。我的问题是,面向行的数据库究竟如何处理信息检索(比如选择查询),以及面向列的数据库有何不同。以及这些数据库在底层平面文件中存储数据的不同之处(最终,每个数据库都使用文件)。
如果我在这个问题的任何部分出错,请纠正我。
问候,克里希纳
java - 在 Java 中使用 PHP 和 Mapreduce 从 HBase 添加/查看/删除数据?
嗨朋友们
我正在生成一个网络爬虫,我想知道一些关于它的事情,
1)我可以使用 Map reduce 从 NET 获取数据
2)我可以将获取的数据保存到 HBase 吗?
3)我可以用 PHP 编写一个应用程序来从 HBase 获取数据吗?如果可以,你能给我一个代码片段吗?如何使用 PHP 从 HBase 添加/查看/删除数据