1

我正在开发一个将在国家层面实施的医疗 php 应用程序。它将被多家医院使用,患者记录将被集中,即每家医院都将访问患者记录并将其添加到同一个数据库中。

我希望应该只有 1 个患者的记录,没有任何重复。简单地说,没有医院可以再次输入同一患者的第二条记录,但为了使其成为可能,我需要知道我们应该使用哪些标准,哪些标准将在患者的整个生命周期内保持不变。在我的脑海中只有 2 个,即姓名和出生日期。

还有哪些其他标准?我不想使用手机号码和电话号码等。而且婴儿不能拥有它。我需要适用于每位患者且独一无二的标准。

请给我您的建议或任何其他更好的方法来实现此功能?

4

4 回答 4

1

我会试一试,因为我参与了一些数据匹配和验证,虽然不是专门在医疗行业。你没有指定一个特定的国家,只是提到了亚洲,所以我将使用我的祖国澳大利亚的一个例子,因为我熟悉规则,我相信这同样适用于许多亚洲国家:

  • 我们有一个用于医疗保健的唯一医疗保险号码,但这不是强制性的,虽然免费/折扣医疗意味着我预计 99% 以上的人会有一个您不能依赖的号码。

  • 还有一个税号,即使你工作也不是强制性的,而且从未工作过的人通常不会有一个。

  • 您可能正在与不是居民的外国人打交道。

  • 驾驶执照当然不是获得医疗保健的强制性要求。

  • “没有固定地址”是完全合法的。再加上有些人会撒谎来接受治疗和重复用药等。更不用说很多人经常搬家了。

  • 更改姓名在结婚/离婚的情况下很常见,除非出于非法目的,否则有人可以仅仅因为他们不喜欢原来的姓名而更改姓名。更不用说人们使用常见的替代品来代替 Jim 和 James 之类的东西。

  • 输入错误在大型数据集上非常常见。

简而言之,我认为您要求的“完美”方案是不可能的。您可以做的最好的事情是应用加权规则来查找可能的重复项。例如,相同的姓名/出生日期/出生地点是不太可能但可能发生的事件,因此向数据输入操作员显示可能重复的警告,并让他们查看可能重复的详细信息。即使像驾驶执照号码这样应该唯一的东西也可能表明原始条目只是有数据输入错误,而不是新的副本。

根据我的经验,最好的事情是一份报告,其中列出了可能的重复项,这些重复项必须由链上更高的人进行审查,并为他们提供一个简单的选项来合并重复项。然后,您可以开始使用更模糊的正则表达式,这些表达式会抛出一些误报,当人们审查它们时可以忽略这些误报。您还可以随着时间的推移优化模型以获得最佳匹配结果。

于 2012-12-26T10:41:49.953 回答
0

您需要使用一些全国性的 ID。比如护照ID,或者健康保险号码。

于 2012-12-26T08:45:42.170 回答
0

可以尝试结合姓名、出生日期、血型、出生地等。

于 2012-12-26T08:48:46.370 回答
0

带有国家/地区的社会保险号。

于 2012-12-26T08:51:26.683 回答