2

HBase Javadoc 对于 HTable.get(List) 方法非常混乱。

作为返回参数文档,我们有以下语句:

如果重试后仍有任何故障,
这些 Gets 的结果数组中将有一个空值,
并且将引发异常。

我不明白“AND”:我们可以在返回的数组中有一个异常或一个空值,而不是像文档所暗示的那样同时存在。

我从未听说过能够引发异常并返回某些内容的 Java 方法。

当我调用这个方法时,我在我的代码中处理了异常,但我是否还需要担心结果数组中的空引用?

4

1 回答 1

0

此处的文档具有误导性,因为此函数不会返回结果并在失败的情况下同时抛出错误。

我挖了这个,因为我也很困惑。

下面是这个函数的源代码

  /** {@inheritDoc} */
  @Override
  public Result[] get(List<Get> gets) throws IOException {
    LOG.trace("get(List<>)");
    Preconditions.checkNotNull(gets);
    if (gets.isEmpty()) {
      return new Result[0];
    } else if (gets.size() == 1) {
      try {
        return new Result[] {get(gets.get(0))};
      } catch (IOException e) {
        throw createRetriesExhaustedWithDetailsException(e, gets.get(0));
      }
    } else {
      try (Scope scope = TRACER.spanBuilder("BigtableTable.get").startScopedSpan()) {
        addBatchSizeAnnotation(gets);
        return getBatchExecutor().batch(gets);
      }
    }
  }

好的,所以如果列表中有多个项目,它会调用getBatchExecutor().batch(gets),该函数的定义如下:

  public Result[] batch(List<? extends Row> actions) throws IOException {
    try {
      Object[] resultsOrErrors = new Object[actions.size()];
      batchCallback(actions, resultsOrErrors, null);
      // At this point we are guaranteed that the array only contains results,
      // if it had any errors, batch would've thrown an exception
      Result[] results = new Result[resultsOrErrors.length];
      System.arraycopy(resultsOrErrors, 0, results, 0, results.length);
      return results;
    } catch (InterruptedException e) {
      Thread.currentThread().interrupt();
      LOG.error("Encountered exception in batch(List<>).", e);
      throw new IOException("Batch error", e);
    }
  }

见那里的评论:

此时我们保证数组只包含结果,如果它有任何错误,批处理会抛出异常

这意味着这个函数只会在失败的情况下引发 IOException 并且没有关于结果的进一步信息。但是,您如何找出批次中的失败和正确处理的项目?原来有另一个版本的batch定义Table的函数支持这种情况:

  /** {@inheritDoc} */
  @Override
  public void batch(List<? extends Row> actions, Object[] results)
      throws IOException, InterruptedException {
    LOG.trace("batch(List<>, Object[])");
    try (Scope scope = TRACER.spanBuilder("BigtableTable.batch").startScopedSpan()) {
      addBatchSizeAnnotation(actions);
      getBatchExecutor().batch(actions, results);
    }
  }

以及相应的定义BatchExecutor

  public void batch(List<? extends Row> actions, @Nullable Object[] results)
      throws IOException, InterruptedException {
    batchCallback(actions, results, null);
  }
  public <R> void batchCallback(
      List<? extends Row> actions, Object[] results, Batch.Callback<R> callback)
      throws IOException, InterruptedException {
    Preconditions.checkArgument(
        results == null || results.length == actions.size(),
        "Result array must have same dimensions as actions list.");
    if (actions.isEmpty()) {
      return;
    }
    if (results == null) {
      results = new Object[actions.size()];
    }
    Timer.Context timerContext = batchTimer.time();
    List<ApiFuture<?>> resultFutures = issueAsyncRowRequests(actions, results, callback);
    // Don't want to throw an exception for failed futures, instead the place in results is
    // set to null.
    List<Throwable> problems = new ArrayList<>();
    List<Row> problemActions = new ArrayList<>();
    List<String> hosts = new ArrayList<>();
    for (int i = 0; i < resultFutures.size(); i++) {
      try {
        resultFutures.get(i).get();
      } catch (ExecutionException e) {
        problemActions.add(actions.get(i));
        problems.add(e.getCause());
        hosts.add(options.getDataHost());
      }
    }
    if (problems.size() > 0) {
      throw new RetriesExhaustedWithDetailsException(problems, problemActions, hosts);
    }
    timerContext.close();
  }

使用此函数,您传入一个(空)results数组,该数组的大小与您的批处理大小相同,该数组在结果输入时被填充。最后,如果批处理中的任何项目失败,则会出现详细信息异常关于他们失败的原因,但您的results数组仍然充满了所有项目的结果。失败的项目将null在该数组中,而其余的则包含一个实际的Result.

于 2020-01-23T13:38:45.867 回答