我的 Data Lake Analytics 作业加载了一个自定义 .NET 程序集,该程序集实现了IExtractor
. 例如,当它仅重新排列文本文件中的数据时,此提取器效果很好,但我真正想做的是通过 HTTP 从供应商的远程 API 中提取我的输入数据。所以我修改了我的提取器实现以发出本质上是一个 REST 请求。
当我这样做时,我的分析日志中出现错误“无法发出 http 请求”。我认为 Microsoft 限制您在 Analytics 的自定义程序集中可以做什么和不能做什么是有道理的,但我在文档中没有找到任何直接说明的内容:您不能在自定义程序集中发出 HTTP 请求。
所以我的问题是两个部分:
- Azure Data Lake Analytics 中自定义程序集的限制记录在哪里?
- 如果我发现大量静态输入文件是获取最新数据的不雅方式,有什么更好的方法可以将我的输入数据提取到分析作业中?