0

我是 DataBricks 和 Apache Spark 的新手。我想为我的笔记本使用 Python。

我正在使用数据块,并且可以确认我已创建:

  • 集群(测试)以及附加的基于 python 的笔记本(测试笔记本)
  • JSON 文件中的表 (employee_info)
  • 笔记本。

我拥有的示例表来自我作为测试文件上传的 JSON,如下所示:

{ 
 "FirstName": "John",
 "LastName": "Mark",
 "MiddleName": "Lewis",
 "username": "johnlewis2",
 "Id ": "29103-1201-E",
 "YearJoined": "2014",
 "MonthJoined": "7",
 "DayJoined": "23",
 "TimeJoined": "14:32",
 "Manager": "Larry Hins",
 "Position": "Web Developer",
 "Building": "Blue Building",
 "Floor": "2"
 }

如果我已经上传了这个表,我该怎么做(假设我使用 Python 作为 Notebook):

  • 访问表
  • 复制一整行
  • 将具有重复列的表另存为新表

谢谢。

4

0 回答 0