0

我正在使用 PySpark 连接到我的 Kudu 数据库。我想用一组谓词检索列中的最小值。似乎在 API 中找不到选项

client = kudu.connect(host="myhost", port=1234)
table = client.table("impala::mydb.mytable")
scanner = table.scanner()
scanner.add_predicates([table['col1'] == 'test'])
scanner.set_project_column_names(['amount'])
myList = scanner.open().read_all_tuples()

以上将检索一个列表,但我不确定如何指定我想要金额列的 MIN 值。

试过了

scanner.set_project_column_names([MIN('amount')])

但这会导致 MIN is not defined 错误。

4

1 回答 1

0

从您的示例看来,您已经在使用 Impala。您可以在 Impala SQL 中使用 MIN 函数来获取最小值。例如:

SELECT MIN(amount) FROM mydb.mytable
于 2018-10-12T23:15:37.523 回答