问题标签 [u-sql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
882 浏览

json - USql 在多维 JSON 数组中调用数据

我在数据湖中有这个 JSON 文件,如下所示:

为了将数据调用到我的应用程序中,我必须使用以下代码将 JSON 转换为字符串:

这会将 JSON 输出到一个可读的 .csv 文件中,当我下载文件时,所有数据都会正确显示。我的问题是当我需要获取配置文件中的数据时。因为 JSON 现在是一个字符串,所以我似乎无法提取任何数据并将其放入变量中以供使用。有没有办法做到这一点?还是我需要研究其他选项来读取数据?

0 投票
2 回答
1711 浏览

u-sql - U-Sql中的文件存在与异常处理

两个问题

  • EXTRACT之前如何检查文件是否存在?我们有每天为目录数据生成新输入文件的场景。我们需要将新输入与 d-1 文件合并。在合并之前我们要确保新的输入文件存在于源位置

  • u-sql 是否支持 try...catch 块?

0 投票
1 回答
332 浏览

arrays - 在 U-SQL 中将 JSON 数组元素显示为一行

如何在 U-SQL 中将每个 JSON 数组元素显示为一行中的逗号分隔元素,而不是每行一个元素?

例如,JSON 文件是:

}

为数组 C1 处理这个片段的代码如下:

所有数组元素都打印为每行一个的结果,即所有 D1 到 D7 元素都在不同的行上。我希望 D1 到 D7 元素成为同一行的一部分,因为它是 JSON 对象的一部分。

那是:

1、2、3、4、5、6、7

如何才能做到这一点?

0 投票
1 回答
245 浏览

azure-data-lake - 构建 E_CSC_USER_NOTAUTHORIZED 时出错:此语句需要数据库“主”的 USE 权限

我一直在尝试构建我的 U-SQL 脚本,甚至使用了下面的示例:

但是,当我构建它时,我收到以下错误:

E_CSC_USER_NOTAUTHORIZED:此语句需要数据库“master”的 USE 权限

我不知道为什么我有这个。我的另一位同事在构建同一个项目时没有问题。我以前能够建造,但由于某种原因我不能再建造了。

有人知道为什么吗?

谢谢。

0 投票
2 回答
1569 浏览

azure-data-lake - 使用 U-SQL 删除空列

我有很多文件要尝试合并。我碰巧知道每个文件中的许多列都只包含空值,我可以不用它们。如何编写 U-SQL 语句来从文件中提取数据,检查除了空值之外什么都没有的列并排除它们?

谢谢!

0 投票
1 回答
624 浏览

azure - 使用 Azure 数据工厂运行 U-SQL 活动的内存不足异常

我在 Azure 数据工厂中将 U-SQL 活动作为管道的一部分运行定义的时间片。U-SQL 活动运行一系列 U-SQL 脚本,这些脚本读入和处理存储在 Azure Data Lake 中的数据。虽然数据在我的本地运行中成功处理,但在 Azure 数据工厂云环境中运行时会引发系统内存不足异常。

输入数据约为 200MB,这不应该是处理问题,因为之前已经处理过更大的数据集。

假设内存管理可以根据需要进行扩展,在 Azure 云环境中看到内存不足异常令人惊讶,以下是在相同输入数据上运行的两次异常快照,唯一的区别是它们发生的时间。

异常快照 - 1

异常快照 - 2

非常感谢任何帮助,谢谢。

进一步更新:在进一步调查中观察到使用变量skipNRow:1跳过标题行解决了这个问题,我们在片段后面的 u-sql 代码有一个以日期比较为条件的循环,它可能循环没有终止,因为给定片段的标题行列的无效日期时间转换正在处理 DateTime 类型的行列作为输入。理想情况下,这应该会给出一个无效的日期时间格式异常,但我们会看到内存不足异常。

0 投票
0 回答
123 浏览

azure - U-sql错误json

我正在尝试从数据湖存储中提取数据,这些数据保存在 json 中。当我尝试提交脚本时,出现错误:

顶点失败触发快速作业中止。顶点失败:SV1_Extract[0] 错误:顶点用户代码错误。

我将添加我使用的: https ://github.com/Azure/usql/tree/master/Examples/DataFormats/Microsoft.Analytics.Samples.Formats

json:

0 投票
1 回答
109 浏览

loops - 如何使用 U-SQL 遍历 SELECT 查询的结果以查找行模式

我在变量中有 SELECT 查询的结果,现在我想逐行遍历查询结果以进行一些处理,例如查找特定模式。例如,模式可能如下:

CSV 中 SELECT 查询的结果可能是:

我已经看到有关使用自定义提取器的 PROCESS 语句的一些内容,但这是这样做的方法吗?我不确定这个过程和提取器是如何工作的。

https://msdn.microsoft.com/en-us/library/azure/mt621322.aspx

谢谢你的帮助。

0 投票
1 回答
362 浏览

azure-data-lake - U-sql调用json数组中的数据

我浏览了网络和论坛以从文件 json 下载数据,但我的脚本不起作用。我在下载费率对象列表时遇到问题。有人可以帮忙吗?我找不到错。

这是我在 sql 中的脚本。

0 投票
1 回答
110 浏览

azure-data-lake - 错误:来自自定义程序集的“无法发出 http 请求”

我的 Data Lake Analytics 作业加载了一个自定义 .NET 程序集,该程序集实现了IExtractor. 例如,当它仅重新排列文本文件中的数据时,此提取器效果很好,但我真正想做的是通过 HTTP 从供应商的远程 API 中提取我的输入数据。所以我修改了我的提取器实现以发出本质上是一个 REST 请求。

当我这样做时我的分析日志中出现错误“无法发出 http 请求”。我认为 Microsoft 限制您在 Analytics 的自定义程序集中可以做什么和不能做什么是有道理的,但我在文档中没有找到任何直接说明的内容:您不能在自定义程序集中发出 HTTP 请求。

所以我的问题是两个部分:

  1. Azure Data Lake Analytics 中自定义程序集的限制记录在哪里?
  2. 如果我发现大量静态输入文件是获取最新数据的不雅方式,有什么更好的方法可以将我的输入数据提取到分析作业中?