我在 python 中使用 Databricks 将 JSON 文件的最终结构更改为数据帧。要在 Databricks 中阅读它,可以使用:
df = sqlContext.sql("SELECT * FROM people")
在使用 Jupyter notebook 时,您可以通过以下方式轻松完成:
df = spark.read.json('people.json', schema = final_struc)
但它如何在数据块中工作?
我在 python 中使用 Databricks 将 JSON 文件的最终结构更改为数据帧。要在 Databricks 中阅读它,可以使用:
df = sqlContext.sql("SELECT * FROM people")
在使用 Jupyter notebook 时,您可以通过以下方式轻松完成:
df = spark.read.json('people.json', schema = final_struc)
但它如何在数据块中工作?