3

是否可以在 Databricks 中导出“魔术 SQL”命令单元的输出?

我喜欢这样一个事实,即不必转义 SQL 命令并且可以轻松格式化。但是,我似乎无法在其他单元格中使用输出。我想做的是将数据导出到 CSV 文件,但可能会在我写出之前完成对数据框的一些最终操作。

sql = "select * from calendar"
df = sqlContext.sql(sql)
display(df.limit(10))

vs (DBricks 格式化以下代码)

%sql
select
  *
from
  calendar

但是想象一下,一旦你引入了转义字符串、嵌套连接等。想知道是否有更好的方法在数据块中使用 SQL。

4

1 回答 1

1

最简单的解决方案是我没有想到的最明显的一个:创建一个视图!

%sql

CREATE OR REPLACE TEMPORARY VIEW vwCalendar as
/*
  Comments to make your future self happy!
 */
select
  c.line1,   -- more comments
  c.line2,   -- more comments
  c.zipcode
from
  calendar
where
  c.status <> 'just an example\'s' -- <<imagine escaping this

现在您可以在后续 SQL 单元格中使用视图 vwCalendar ,就像任何其他表一样。

如果你想在 python 单元格中使用它:

df = spark.table("vwCalendar")
display(df.limit(3))

https://docs.databricks.com/spark/latest/spark-sql/language-manual/sql-ref-syntax-ddl-create-view.html

https://docs.databricks.com/spark/latest/spark-sql/udf-python.html#user-defined-functions---python

于 2021-02-05T16:00:07.167 回答