我有一种情况,第三方将数据存储在日常表中,如果记录数超过 200 万,则会创建一个后续表,依此类推,名为 [date]_x。
现在,我们有一个报告要求,需要使用这些数据。过去已经执行了手动 UNION SQL 和其他 ETL 操作,我正在尝试将其自动化。
我的第一感觉是将所有内容都放入数据湖中,并在 AWS 上进行 map-reduce。然而,看着 Tableau,我希望利用它的一些自动化来加快解决方案。现在,我不确定这是最好的解决方案。
请问有什么建议吗?
我有一种情况,第三方将数据存储在日常表中,如果记录数超过 200 万,则会创建一个后续表,依此类推,名为 [date]_x。
现在,我们有一个报告要求,需要使用这些数据。过去已经执行了手动 UNION SQL 和其他 ETL 操作,我正在尝试将其自动化。
我的第一感觉是将所有内容都放入数据湖中,并在 AWS 上进行 map-reduce。然而,看着 Tableau,我希望利用它的一些自动化来加快解决方案。现在,我不确定这是最好的解决方案。
请问有什么建议吗?