1

我正在使用 Databricks 运行 Spark 集群。我想使用 curl 从服务器传输数据。例如,

curl -H "Content-Type: application/json" -H "auth:xxxx" -X GET "https://websites.net/Automation/Offline?startTimeInclusive=201609240100&endTimeExclusive=201609240200&dataFormat=json" -k > automation.json

如何在 Databricks 笔记本中执行此操作(最好在 python 中,但 Scala 也可以)?

4

2 回答 2

5

在 Databricks 中,您可以通过将 %sh 作为单元格的第一行来从单元格运行 shell 命令:

%sh
curl -H "Content-Type: application/json" -H "auth:xxxx" -X GET "https://websites.net/Automation/Offline?startTimeInclusive=201609240100&endTimeExclusive=201609240200&dataFormat=json" -k > automation.json
于 2018-03-04T09:22:15.717 回答
4

在 Scala 中,您可以执行以下操作:

import sys.process._
val command = """curl -H "Content-Type: application/json" -H "auth:xxxx" -X GET "http://google.com" -k > /home/user/automation.json"""
Seq("/bin/bash", "-c", command).!!
于 2016-09-28T15:07:00.033 回答