数据脱敏

<< Click to Display Table of Contents >>

当前位置:  创建数据集 > 自服务数据集 > 数据治理 > 列属性 

数据脱敏

Previous pageReturn to chapter overviewNext page

敏感数据,又称隐私数据,常见的敏感数据有: 姓名、身份证号码、地址、电话号码、银行账号、邮箱地址、所属城市、邮编、密码类 ( 如账户查询密码、取款密码、登录密码等 )、组织机构名称、营业执照号码、银行帐号、交易日期、交易金额等。

随着大数据时代的到来,大数据商业价值的挖掘,用户的精准定位,大数据中蕴藏的巨大商业价值被逐步挖掘出来,但是同时也带来了巨大的挑战--个人隐私信息的保护。个人信息与个人行为(比如位置信息、消费行为、网络访问行为)等,这些都是人的隐私,也是我们所关注的一类敏感信息,在大数据价值挖掘的基础上如 何保护人的隐私信息,也将是数据脱敏必须解决的难题。

当登录用户的角色是admin_role或groupAdmin_role时,在数据集资源树最上面有数据脱敏图标,如下图所示:

masking1

 

点击图标打开数据脱敏对话框:

masking2

 

点击添加图标,编辑脱敏规则名称,命名为“脱敏”:

masking3

【脱敏算法】选择对敏感数据使用的算法。目前只支持替换字符。

【算法参数】脱敏算法是替换字符时,需要对数据进行替换的配置。

【脱敏用户】应用数据脱敏规则的用户,可以选择用户,组和角色。

 

例如

对数据集中的列PRODUCT设置脱敏规则,脱敏前的数据如下图所示:

beforemasking

 

设置的脱敏规则如下图所示:

maskingforProduct

 

应用该脱敏规则:

maskingforProduct1

 

保存数据集后,切换用户admin_lily登录,预览数据集,PRODUCT列显示如下图所示:

aftermasking

 

在编辑报告中绑定PRODUCT列到表格上,数据显示如下:

masking6