1

我在数据块上运行一个 sql 笔记本。我想分析一个包含十亿条记录的表。我可以对数据运行简单的 sql 查询。但是,我需要将日期列类型从 str 更改为 date。

不幸的是,sparkSQL 似乎不支持更新/更改语句,所以我似乎无法修改表中的数据。

允许我在下一个单元格中将 SQL 表转换为 python 数据结构(在 pyspark 中)的一行代码是什么? 然后我可以修改文件并将其返回给 SQL。

4

2 回答 2

5
dataFrame = sqlContext.sql('select * from myTable')
于 2016-08-19T19:25:11.047 回答
1
df=sqlContext.sql("select * from table")

要将数据框转换回 sql 视图,

df.createOrReplaceTempView("myview")
于 2019-01-06T01:23:55.143 回答