问题标签 [hbasestorage]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache-pig - 使用 HBaseStorage 通过 Dataproc 上的 Pig 从 Bigtable 加载
是否有人有使用 HBaseStorage 在 Dataproc 上通过 Pig 从 Bigtable 加载数据的经验或成功?
这是我正在尝试运行的一个非常简单的 Pig 脚本。它失败并显示一个错误,表明它找不到 BigtableConnection 类,我想知道我可能缺少什么设置才能成功从 Bigtable 加载数据。
我设置集群的步骤:
- 推出 Bigtable 集群(my_bt);创建并填充 my_hbase_table
- 通过 cloud.google.com Cloud Dataproc 控制台启动了 Dataproc 集群 (my_dp)
- 按照https://cloud.google.com/bigtable/docs/installing-hbase-shell上的说明在 Dataproc 主服务器 (/opt/hbase-1.2.1) 上安装 HBase shell
hbase-site.xml
为 my_bt 和 BigtableConnection 类添加了属性- 创建的文件
t.pig
包含上面列出的内容 - 通过命令调用 Pig:
gcloud beta dataproc jobs submit pig --cluster my_dp --file t.pig --jars /opt/hbase-1.2.1/lib/bigtable/bigtable-hbase-1.2-0.9.5.1.jar
- 出现以下错误,指示未找到 BigtableConnection 类:
2017-03-21 15:30:48,029 [JobControl] 错误 org.apache.hadoop.hbase.mapreduce.TableInputFormat - java.io.IOException: java.lang.ClassNotFoundException: com.google.cloud.bigtable.hbase1_2.BigtableConnection
hbase - Hbase rest api 多次插入
我们计划使用 hbase rest api 对 hbase 表执行插入操作,并想知道是否有办法将多个列插入单个列族,甚至在一次调用中插入多个列族。
如果不是,因为我们计划为特定记录(行)插入大约 100+ 列,这将导致我们对单个行条目进行 100+ 次调用