我试图找出一种解决方案,通过使用 Azure 队列和 WebJobs 来获取数据,以重复聚合数千个远程 XML 和 JSON 数据文件。
基本上,将在 Azure 网站/应用程序上调用某种类型的输入端点 URL(使用数据 URL 作为参数)。它应该触发 WebJobs 后台作业(或者它可以持续运行并定期检查队列是否有新工作),获取数据 URL,然后在完成时回调外部端点 URL。
现在主要关注的是数量及其性能/扩展/定价开销。每 10-60 分钟将获取大约 10,000 个 URL(大多数 URL 将每 60 分钟获取一次)。关于这种重复性大批量后台作业的场景,我有几个问题:
Azure WebJobs(或 Workers?)是否适合在此数量上进行后台处理,并且能够相应地进行扩展?
对于此类卷,哪个 Azure 网站层最适合(比较http://azure.microsoft.com/en-us/pricing/details/app-service/)?还是只有云或虚拟机才能以这种规模工作?
任何建议或提示表示赞赏。