0

我有一个 SQL DB,其中包含PHI托管在AWS. 我想访问这些数据以执行分析,但是,我必须首先对数据进行去标识化以符合HIPAA.

我应该如何处理这个?我想到了几种方法:

  1. 只需使用命令对数据库进行去标识化。SQL
  2. 从现在开始,每次添加数据库时,将该数据的去识别版本添加到另一个数据库。然后访问此数据库进行分析。
  3. 从现在开始,每次添加数据库时,将该数据的去识别版本添加到该数据库中的另一个表中。然后使用 SQL 命令访问此表以进行分析。

使用哪种方法来保持对 HIPAA 的合规性最好?或者,还有更好的方法?

谢谢!

4

1 回答 1

2

预算允许,考虑在不同的系统上进行分析,在 ETL 期间,对数据进行去标识化。更改源系统以适应此要求将增加维护的复杂性并可能影响其他集成 - 最终可能会导致单体应用。

有多种方法可以做到这一点:您可以使用 DB 作为源和 S3 作为目标(镶木地板格式)来执行AWS DMS(具有持续复制)。从那里您可以使用Athena进行分析,突出显示 jarmod,它还支持 parquet 格式,您甚至可以在 Athena 中使用类似 SQL 的查询来分析您的数据。还有 Redshift、发送到另一个关系数据库、其他分析平台等。

于 2020-07-14T19:36:10.430 回答