HBase Javadoc 对于 HTable.get(List) 方法非常混乱。
作为返回参数文档,我们有以下语句:
如果重试后仍有任何故障, 这些 Gets 的结果数组中将有一个空值, 并且将引发异常。
我不明白“AND”:我们可以在返回的数组中有一个异常或一个空值,而不是像文档所暗示的那样同时存在。
我从未听说过能够引发异常并返回某些内容的 Java 方法。
当我调用这个方法时,我在我的代码中处理了异常,但我是否还需要担心结果数组中的空引用?
此处的文档具有误导性,因为此函数不会返回结果并在失败的情况下同时抛出错误。
我挖了这个,因为我也很困惑。
下面是这个函数的源代码:
/** {@inheritDoc} */
@Override
public Result[] get(List<Get> gets) throws IOException {
LOG.trace("get(List<>)");
Preconditions.checkNotNull(gets);
if (gets.isEmpty()) {
return new Result[0];
} else if (gets.size() == 1) {
try {
return new Result[] {get(gets.get(0))};
} catch (IOException e) {
throw createRetriesExhaustedWithDetailsException(e, gets.get(0));
}
} else {
try (Scope scope = TRACER.spanBuilder("BigtableTable.get").startScopedSpan()) {
addBatchSizeAnnotation(gets);
return getBatchExecutor().batch(gets);
}
}
}
好的,所以如果列表中有多个项目,它会调用getBatchExecutor().batch(gets)
,该函数的定义如下:
public Result[] batch(List<? extends Row> actions) throws IOException {
try {
Object[] resultsOrErrors = new Object[actions.size()];
batchCallback(actions, resultsOrErrors, null);
// At this point we are guaranteed that the array only contains results,
// if it had any errors, batch would've thrown an exception
Result[] results = new Result[resultsOrErrors.length];
System.arraycopy(resultsOrErrors, 0, results, 0, results.length);
return results;
} catch (InterruptedException e) {
Thread.currentThread().interrupt();
LOG.error("Encountered exception in batch(List<>).", e);
throw new IOException("Batch error", e);
}
}
见那里的评论:
此时我们保证数组只包含结果,如果它有任何错误,批处理会抛出异常
这意味着这个函数只会在失败的情况下引发 IOException 并且没有关于结果的进一步信息。但是,您如何找出批次中的失败和正确处理的项目?原来有另一个版本的batch
定义Table
的函数支持这种情况:
/** {@inheritDoc} */
@Override
public void batch(List<? extends Row> actions, Object[] results)
throws IOException, InterruptedException {
LOG.trace("batch(List<>, Object[])");
try (Scope scope = TRACER.spanBuilder("BigtableTable.batch").startScopedSpan()) {
addBatchSizeAnnotation(actions);
getBatchExecutor().batch(actions, results);
}
}
以及相应的定义BatchExecutor
:
public void batch(List<? extends Row> actions, @Nullable Object[] results)
throws IOException, InterruptedException {
batchCallback(actions, results, null);
}
public <R> void batchCallback(
List<? extends Row> actions, Object[] results, Batch.Callback<R> callback)
throws IOException, InterruptedException {
Preconditions.checkArgument(
results == null || results.length == actions.size(),
"Result array must have same dimensions as actions list.");
if (actions.isEmpty()) {
return;
}
if (results == null) {
results = new Object[actions.size()];
}
Timer.Context timerContext = batchTimer.time();
List<ApiFuture<?>> resultFutures = issueAsyncRowRequests(actions, results, callback);
// Don't want to throw an exception for failed futures, instead the place in results is
// set to null.
List<Throwable> problems = new ArrayList<>();
List<Row> problemActions = new ArrayList<>();
List<String> hosts = new ArrayList<>();
for (int i = 0; i < resultFutures.size(); i++) {
try {
resultFutures.get(i).get();
} catch (ExecutionException e) {
problemActions.add(actions.get(i));
problems.add(e.getCause());
hosts.add(options.getDataHost());
}
}
if (problems.size() > 0) {
throw new RetriesExhaustedWithDetailsException(problems, problemActions, hosts);
}
timerContext.close();
}
使用此函数,您传入一个(空)results
数组,该数组的大小与您的批处理大小相同,该数组在结果输入时被填充。最后,如果批处理中的任何项目失败,则会出现详细信息异常关于他们失败的原因,但您的results
数组仍然充满了所有项目的结果。失败的项目将null
在该数组中,而其余的则包含一个实际的Result
.