问题标签 [spark-notebook]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

84 问题

0 投票

1 回答

107 浏览

apache-spark - 在数据块中过滤 %[A-Za-z]%

我正在尝试table.column LIKE '%[A-Za-z]%在 Databricks 笔记本中使用，但它没有返回任何值。

它在 SQL server 中工作，但似乎在 Pysql 中不起作用。

有谁知道 Databricks 中的替代方案是什么？

2021-02-16T12:32:46.550

0 投票

1 回答

315 浏览

azure - Azure databricks CI CD 管道用于删除生产中的笔记本

我有一个 CI/CD 管道，可以在 Azure Databricks 工作区中将笔记本从开发部署到生产。

但是，当这些笔记本已从开发中删除并且不再位于 Azure git 存储库中时，它不会从生产中删除这些笔记本。

作为构建/发布过程的一部分，我想删除所有已从源中删除的笔记本。有没有办法做到这一点？

azure continuous-integration databricks azure-pipelines-release-pipeline spark-notebook

2021-03-03T07:51:34.300

0 投票

1 回答

250 浏览

pyspark - Databricks Delta 文件添加新分区会导致旧分区不可读

我有一个笔记本，我正在使用它来加载历史记录。每次加载 6 个月的数据，从2018-10-01. 我的增量文件按 calendar_date 分区

初始加载后，我能够读取增量文件并查看数据就好了。

但是在第二次加载 date 之后2019-01-01 to 2019-06-30，以前的分区没有使用 delta 格式正常加载。

像这样读取我的源增量文件会引发我的错误说

file dosen't exist

然而，像下面这样的阅读就可以很好地知道可能出了什么问题

pyspark databricks delta-lake spark-notebook

2021-03-05T21:49:03.530

0 投票

0 回答

835 浏览

azure-synapse - 从 Azure Synapse spark notebook 连接到 SQL-Pool 表

我正在寻找如何使用 Scala Spark 从另一个工作区的 SQL 池中读取 Azure Synapse 表，但没有成功（因为它显然是唯一的选择）。我在https://docs.microsoft.com/en-us/azure/synapse-analytics/spark/synapse-spark-sql-pool-import-export#use-pyspark-with-the-connector中发现了非常有用的示例，但是不适合我的情况。

我想知道是否可以将链接服务作为选项添加到以下查询？

像这样的东西：

我找不到任何关于此的文档。

我的问题是我正在使用专用网络，两个突触工作区都通过专用端点连接，它们运行良好，因为我可以使用管道连接到 SQL 池。我的目标是使用 Spark Notebook 实现相同的目标。

出于某种原因，我收到了错误：

错误：com.microsoft.spark.sqlanalytics.exception.SQLAnalyticsConnectorException：com.microsoft.sqlserver.jdbc.SQLServerException：数据泄露到“DATALAKE_NAME.dfs.core.windows.net”被阻止。将目标添加到允许的数据泄露列表，然后重试。

但我不明白为什么它告诉我“数据泄露到 DATALAKE 被阻止？我试图访问 SQL-Pool，而不是数据湖，无论如何我也刚刚为数据湖创建了一个私有端点，但它仍然无法正常工作。

有谁知道这是否可能？

azure-synapse spark-notebook

2021-04-16T11:56:45.277

0 投票

0 回答

60 浏览