我不使用数据库,所以想在开始之前确认最佳实践。我得到了一个项目,我应该在其中获取一些不同建模的数据文件,处理它们并显示一些标准报告。
这将是批量摄取,最多可以是每周或每天。我们将使用的云是 Microsoft Azure。根据我的开发经验,我正在考虑以下工具来完成这项工作。但是会喜欢你们的一些建议:
-> Ingestion [and stage] => 编写一个 rest api 来获取数据并在 Elastic 中暂存
-> 处理 -> Azure HDInsight .. 我没有使用它,但从简短的阅读来看,这听起来像是推荐的选择。
-> 暂存和报告 -> 使用 Kibana/Graphana 返回弹性搜索。我用过这些工具,所以更喜欢它。
我还阅读了一些推荐 Azure 数据工厂的文章。期待提出一些建议。
问候, Gaurav Sharma