所以,我在 Spark 中使用 Amazon Deequ,并且我有一个数据框,其中df
有一列publish_date
类型为DateType
. 我只是想检查以下内容:
publish_date <= current_date(minus)x AND publish_date >= current_date(minus)y
其中x
和y
是整数。
我不确定在这里放什么支票:
val verificationResult: VerificationResult = { VerificationSuite()
.onData(df)
.addCheck(
Check(CheckLevel.Error, "Review Check")
//function to check this
)
.run()
}