python - 如何检索 Apache Kudu 表列的 MIN 值？

Question

我正在使用 PySpark 连接到我的 Kudu 数据库。我想用一组谓词检索列中的最小值。似乎在 API 中找不到选项

client = kudu.connect(host="myhost", port=1234)
table = client.table("impala::mydb.mytable")
scanner = table.scanner()
scanner.add_predicates([table['col1'] == 'test'])
scanner.set_project_column_names(['amount'])
myList = scanner.open().read_all_tuples()

以上将检索一个列表，但我不确定如何指定我想要金额列的 MIN 值。

试过了

scanner.set_project_column_names([MIN('amount')])

但这会导致 MIN is not defined 错误。

score 0 · Accepted Answer

从您的示例看来，您已经在使用 Impala。您可以在 Impala SQL 中使用 MIN 函数来获取最小值。例如：

SELECT MIN(amount) FROM mydb.mytable

python - 如何检索 Apache Kudu 表列的 MIN 值？

1 回答 1

Related

Reference