有没有人尝试过基于模型的测试来为基于 Spark/Scala 的数据管道编写集成测试?
我的数据管道做一些基本的事情——提取输入数据、转换和少数分组计算,将输出数据加载到 AWS S3。
任何参考文档或示例都非常有助于在 ETL 管道的数据帧/数据集上应用基于模型的测试。
谢谢, 里沙布
有没有人尝试过基于模型的测试来为基于 Spark/Scala 的数据管道编写集成测试?
我的数据管道做一些基本的事情——提取输入数据、转换和少数分组计算,将输出数据加载到 AWS S3。
任何参考文档或示例都非常有助于在 ETL 管道的数据帧/数据集上应用基于模型的测试。
谢谢, 里沙布