我正在使用的数据源很糟糕。有些地方你会期望整数,你会得到“三”。在电话号码字段中,您可能会得到“电话号码是 xxx”。有些字段只是空白。
没关系,因为我正在解析每个字段,所以“三”将在我的模型中以整数 3 结束,电话号码(等)将通过正则表达式提取。该服务的用户知道数据是粗略的和不完整的,因为这是我们的数据源维护方式的不幸事实,我们无能为力,只能加强我们的解析游戏!顺便说一句,随着我们解析越来越多的原始数据,我们正在缓慢地生成我们自己的数据版本,但这个糟糕的来源现在必须做。
所以用户选择他们想要解析的数据,然后我们尽我们所能,返回一个部分/不正确的模型。现在应该验证我们要存储的最终模型 - 某些字段不能为空,某些字符串必须遵守格式等等。
该应用程序的流程是:
- 用户告诉服务要解析哪些数据。
- 服务启动并抓取数据,解析它可以解析的内容并返回一个包含它可以检索到的任何数据的部分模型。
- 我们向用户显示数据,允许他们进行更正并填写未收集数据的任何必填字段。
- 该用户更正的数据将被保存并因此得到验证。
- 如果验证失败,请再次显示数据以供用户修复、冲洗并重复。
让模型开始可能完全无效或不包含数据但最终需要验证的最佳方法是什么?我想到(并部分实施)的两种方法是:
- 2 个模型 - 一个具有验证等的数据模型和一个没有验证的 UnconfirmedData 模型。原始数据被放入 UnconfirmedData 模型,直到用户进行更正,此时将其放入 Data 模型并尝试验证。
- 一种带有“已确认数据”标志的模型,其验证是手动执行的,而不是 Rails 的验证。
在实践中,我倾向于使用 2 种模型,但我对 Rails 还很陌生,所以我认为我有更好的方法来做到这一点,Rails 有这样让我惊讶的习惯 :)