代码之家  ›  专栏  ›  技术社区  ›  kishore

数据屏蔽/置乱

  •  1
  • kishore  · 技术社区  · 15 年前

    这是专门为医疗领域。在将数据从生产环境复制到测试环境时,您使用什么解决方案/工具来屏蔽phi数据

    1 回复  |  直到 8 年前
        1
  •  0
  •   paxdiablo    12 年前

    不是针对医疗保健行业,但我们对电信客户有类似的要求。我们希望能够在测试系统中提供有代表性的数据,但要确保不复制敏感信息。

    为此,我们尝试了许多不同的方法,包括我们选择的方法:

    1. 将使用而不是直接表访问的视图-这些视图基本上将实际表中的非敏感信息与单独表中的伪信息连接起来。虚拟信息替换了真实表中的所有敏感信息。

    2. 通过清理筛选器传输数据。这基本上会卸载生产数据库,并将其通过一个匿名程序来替换敏感信息。对于简单的情况,地址等设置都是相同的。

    3. 类似于上面的(2),但是过滤器可以使用来自特定查找数据的数据。例如,一个地址可以由一个4位数的街道号码、从1000个最常见的街道名称中选择的名称、街道类型(街道、街道、街道、道路、地点等)和城镇数据库组成。电话号码可以是10位数字的任意序列(根据电信公司的要求),但不能重复。