1

我正在编写此代码以获取指定表中计数的整数值:

sc = SparkContext("local", "spar")
hive_context = HiveContext(sc)
hive_context.sql("use zs_trainings_trainings_db")
df = hive_context.sql("select count(*) from ldg_sales")
4

2 回答 2

1

任何一个:

hive_context.table("sales").count

或者

hive_context.sql("select count(*) from ldg_sales").first()[0]
于 2017-05-04T07:50:23.570 回答
0

将数据框转换为 rdd,以便您可以在其上运行 map 任务以提取行值,例如 -

df = hive_context.sql("select count(*) as cnt from ldg_sales")
count = df.rdd.map(lambda _ : _.cnt).collect()[0]
于 2017-05-04T12:16:20.263 回答