问题标签 [u-sql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
450 浏览

azure-data-lake - 如何避免向 U-SQL 表添加重复项

除了添加/截断分区之外,有没有办法避免在 U-SQL 表中添加重复记录。让我们假设两个记录只有唯一标识符不同。

0 投票
1 回答
840 浏览

azure-data-lake - 使用输出程序时,标题行未出现在 CSV 的顶部

在 u-sql 查询中,通过 Outputterss.Csv() 函数将数据从一个 csv 文件转储到另一个文件,但带有列名的标题行出现在文件末尾而不是顶部。请在下面找到我的代码。感谢您的帮助。

0 投票
1 回答
163 浏览

azure-data-lake - 本地 U-SQL 表与 ADLA 的性能差异?

与我们从 ADLA 创建和使用表时相比,插入/查询到本地 U-SQL 表非常快。我们能够在大约 8 分钟内将数据从 CSV 插入到本地的三个表中,而无需使用任何并行性,并且在 ADLA 上以 10 的并行度执行相同的作业大约需要 10 分钟(不设置并行度作业需要更长的时间)。我们能达到同样的性能吗?

0 投票
1 回答
114 浏览

azure-data-lake - 向 U-SQL 表插入数据耗时过长?

将数据插入 U-SQL 表需要太多时间。我们正在使用分区表来重新计算先前处理的数据。在具有 11、5 和 1 分区且并行度设置为 10 的三个表上,第一次插入花费了将近 10-12 分钟。第二次插入相同数据花费了将近 4 个小时。目前我们正在使用基于年份的分区。我们在不添加分区的情况下测试了插入和查询,性能要好得多。这是分区表的问题吗?

0 投票
2 回答
1332 浏览

azure-data-lake - 如何按子句顺序获取数据湖中u-sql中的所有行

在编写 u-sql 查询时,我正在使用 Order by 子句 FETCH 子句是必须使用的,但如果不想从行集中获取有限数量的行但我应该写什么。感谢帮助

0 投票
1 回答
1906 浏览

azure-data-lake - 我们如何根据时间戳作业在 azure 数据湖中的 u-sql 中获得动态输出文件名

我们如何在作业执行时根据时间戳在 azure 数据湖中的 u-sql 中获得动态输出文件名。感谢您的帮助。我的代码如下:

0 投票
1 回答
278 浏览

azure-data-lake - 我可以从 U-SQL 中的参数化 TVF 中选择,但不能交叉应用

我可以从 U-SQL 中的参数化表值函数中进行选择,但我似乎无法在 CROSS APPLY 中使用它。请参阅@query1,我可以在其中从我的 TVF 中进行基本选择。请参阅@query3 了解我使用 SQL.MAP 的解决方法。请参阅@query2,它不起作用并已被注释掉。这是受支持的模式吗?返回的错误是

“C# 错误 CS0103:当前上下文中不存在名称‘temp’”。

0 投票
1 回答
3901 浏览

json - U-SQL - 从 json-array 中提取数据

已经尝试过建议的 JSONPath 选项,但 JSONExtractor 似乎只能识别根级别。在我的情况下,我必须处理嵌套的 json 结构,以及一个数组(参见下面的示例)。在没有多个中间文件的情况下提取它的任何选项?

选择关系ID、地址ID、街道、邮政编码、城市?

0 投票
2 回答
499 浏览

azure-data-lake - 在本地运行 U-SQL 脚本的系统错误

当我尝试在本地运行 U-SQL 脚本时,出现以下错误:

我可以在 Visual Studio 中运行在 Data Lake Store 中执行的脚本,但只有在尝试在本地运行脚本时才会出现错误。

我在 64 位 Windows 7 上使用 Visual Studio 15 社区。

0 投票
1 回答
797 浏览

azure - U-SQL 表与 SQL 数据仓库

所以这就是我所在的位置。

我在 Data Lake Store 中存储了大量数据。但是当我想制作一份报告(可能是一个月的价值)时,我想将其模式化为一个表格,以便在查询时一遍又一遍地参考。

我应该只使用 Data Lake Analytics 通过创建 U-SQL 表 ( https://msdn.microsoft.com/en-us/library/azure/mt621301.aspx )提供的内置数据库功能,还是应该在SQL 数据仓库?我想我真正想知道的是这两种情况的优缺点是什么,什么时候最好使用?

顺便说一句,我是这个 Microsoft Azure 世界的菜鸟。还在积极学习。