0

好的 - 对于我的项目,我被要求为我们必须转换一些数据的过程确定一些验证技术。让我给你一个背景。

我们从客户端接收数据 - 我们加载文件,并且只提取处理所需的字段。在这个阶段进行了一些检查。从这里我们在数据上运行脚本,这些脚本基本上完成了所有繁重的工作。(删除重复项、检查日期等)。然后它通过一个黑盒系统运行并向我们吐出结果。

客户通知我们,我们对特定群体的计数非常差。这个大约4百万美元。

我们有一个识别唯一成员的过程,通过生成一个 pol_ID、一个 Suf_ID 及其关联的组名,它们在我们的系统和我们的处理系统中被认为是唯一的。

我们需要一个流程来处理这些唯一成员的记录。在给定的时间段内,唯一成员可以拥有与其姓名相关联的一对多声明。

当我们收到索赔信息时,一般是使用payor_field + claimno + 一个生成的序列号(有时这个序列号就是claimno的最后两位)来处理的……

前任。三个索赔进入系统,通过加载处理后,我们看到客户端重复了索赔号 - 因为我们使用最后两位数字,它不再使它们唯一,并删除了三个记录中的两个。只保留第一个。

WKS-01100 75.02 - stays
WKS-01100 6000.56 - drops
WKS-01100 560.23 - drops

我的问题开始起作用,因为我们通常对声明进行假设,即如果我们解析最后两位数字,它是唯一的,在测试这种情况下,我们尝试在另一列中创建显式增量序列号以考虑这个唯一性。然后使我们的结果翻倍。

现在我的问题如下:

还有另一种方法可以使这些声明独一无二吗?自动增量不是一个选项。考虑到客户可以发送重复的claimno,这是我们的问题所在,他们可能会回收他们的claimno。

由于它是基于月份的,所以最后可能会有某种月份 ID..?

序列号的任何二进制表示都会起作用吗?它是一个 INT 数据类型。(还应注意,我们处理可追溯到 24 个月的历史数据,并且每个月我们都会获得下一个连续月份的数据,并且我们会删除集合中的第一个月)

我们不限于我们为转换此声明所做的工作,因此我愿意接受建议...尽量保持简短,但如果我需要添加更多信息,请告诉我 :) 谢谢。

4

1 回答 1

0

您是否为每个索赔保存了时间戳?一种可能的解决方案是附加时间戳以使声明唯一。

WKS-01100-1330464175

WKS-01100-1327514036

WKS-01100-1341867984

于 2013-02-28T15:57:38.333 回答