我是 DataBricks 和 Apache Spark 的新手。我想为我的笔记本使用 Python。
我正在使用数据块,并且可以确认我已创建:
- 集群(测试)以及附加的基于 python 的笔记本(测试笔记本)
- JSON 文件中的表 (employee_info)
- 笔记本。
我拥有的示例表来自我作为测试文件上传的 JSON,如下所示:
{
"FirstName": "John",
"LastName": "Mark",
"MiddleName": "Lewis",
"username": "johnlewis2",
"Id ": "29103-1201-E",
"YearJoined": "2014",
"MonthJoined": "7",
"DayJoined": "23",
"TimeJoined": "14:32",
"Manager": "Larry Hins",
"Position": "Web Developer",
"Building": "Blue Building",
"Floor": "2"
}
如果我已经上传了这个表,我该怎么做(假设我使用 Python 作为 Notebook):
- 访问表
- 复制一整行
- 将具有重复列的表另存为新表
谢谢。