1

我的 Data Lake Analytics 作业加载了一个自定义 .NET 程序集,该程序集实现了IExtractor. 例如,当它仅重新排列文本文件中的数据时,此提取器效果很好,但我真正想做的是通过 HTTP 从供应商的远程 API 中提取我的输入数据。所以我修改了我的提取器实现以发出本质上是一个 REST 请求。

当我这样做时我的分析日志中出现错误“无法发出 http 请求”。我认为 Microsoft 限制您在 Analytics 的自定义程序集中可以做什么和不能做什么是有道理的,但我在文档中没有找到任何直接说明的内容:您不能在自定义程序集中发出 HTTP 请求。

所以我的问题是两个部分:

  1. Azure Data Lake Analytics 中自定义程序集的限制记录在哪里?
  2. 如果我发现大量静态输入文件是获取最新数据的不雅方式,有什么更好的方法可以将我的输入数据提取到分析作业中?
4

1 回答 1

3

此限制将记录在即将发布的有关编写自定义运算符的文档中(计划最晚在年底发布)。

我通常会在我的演示文稿中提及它,但我注意到它在幻灯片中并不明确。我会解决的:)。

我们不允许外部调用的主要原因是,一个设计糟糕的 UDO 可以扩展到大量数据,对于该外部服务的 REST 端点来说可能看起来像一个 DDOS,因此要么将其关闭,要么将 Azure 列入黑名单。

请通过http://aka.ms/adlfeedback告诉我们您想要实现的目标,我们将看看是否可以添加一些功能来实现这一目标,而不会出现上述缺点。

于 2016-10-13T21:41:07.253 回答