国内动态脱敏技术演进技术探讨-k8凯发天生赢家

您当前的位置 : k8凯发天生赢家 > 技术博客 > 数据安全

内容中心

按关键字查找

trap1：select * ，一个简单但是难填的坑。

对于策略，常用做法是指定需要脱敏的字段或字段通配符，如此一来，必然会面临以下问题：

场景1：配置了字段abc需要进行脱敏处理，而用户执行的操作是select *，并没有在操作中写明字段名，这种情况还能针对字段abc成功脱敏吗？

场景2：配置了字段abc需要进行脱敏处理，但用户应用系统“每天自动产生一个包含这个字段的表，并且表中的这个字段的数据也需要脱敏”，应对每天增量产生的表执行select *操作，可以做到及时成功脱敏吗？

技术应对：动态脱敏产品自动根据用户发起的sql命令进行分析，实时检查select *这一命令操作的表有哪些字段，并根据实时检查的结果自动对数据进行脱敏。

trap2：用户执行的sql命令中对敏感字段执行了函数转换，是否会造成绕过脱敏的结果？

场景：配置了字段abc需要进行脱敏处理，用户执行的操作是select substr(abc,1,2),field1,field3,substr(abc,2,5) from table，该操作中敏感字段的数据被“拆开”来使用，能够成功脱敏吗？

技术应对：合格的动态脱敏产品，是作用在请求的sql操作的字段上，而不是对返回的结果集进行变形处理，否则会造成无法适应各种复杂的sql命令而产生结果集数据。

trap3：词法分析还是语法分析，这是个准确度问题。

目前，动态脱敏主流的实现方式是采用网关或代理的方式（informatica ddm和安华金和ddm正是采用这种实现方式），在客户端和服务器之间按照策略进行sql操作的改写，来实现数据脱敏效果。这个改写过程必然需要对sql语句进行拆包和分析，可供选择的技术路线包括正则匹配、词法分析、语法分析；但正则匹配非常不准确，首先被淘汰掉；接下来就面临到底是选择词法分析还是语法分析的问题了。

众所周知，语法分析非常复杂，词法分析则相对简单很多，二者能够达到的脱敏准确度也会不同，见典型场景：

场景：配置表ta的字段abc需要脱敏，表tb的abc字段不脱敏；用户执行的sql操作为select a.abc,b.abc from ta a,tb b where a.id=b.id；该语句需要正确识别出脱敏对象。

技术应对：通过语法分析，正确的识别a.abc字段为需要脱敏的字段，b.abc字段不能进行脱敏。

trap4：执行begin...end语句块，语句块中包含动态sql语句，如何处理？

场景：配置persionid为需要脱敏的字段，用户在plsql客户端工具中执行下面的语句块：

declare
-- local variables here
v_sql_1 varchar2(1000);
v_sql_2 varchar2(1000);
v_sql varchar2(1000);
v_cursor   number;
v_stat      number;
v_persionid      varchar2(50);
v_date      varchar2(10);
begin
-- test statements here
-- 拼接sql命令
v_sql_1:='select per';
v_sql_2:='sionid,to_char(datefield, ''yyyy-mm-dd'') from performance_c_1000000 where rownum<100';
v_sql:=v_sql_1||v_sql_2;
v_cursor := dbms_sql.open_cursor; --打开游标
dbms_sql.parse(v_cursor, v_sql, dbms_sql.native); --解析sql
dbms_sql.define_column(v_cursor, 1, v_persionid,50);         --定义列
dbms_sql.define_column(v_cursor, 2, v_date, 10);
v_stat := dbms_sql.execute(v_cursor);        --执行sql
-- 循环获取数据
loop
exit when dbms_sql.fetch_rows(v_cursor) <= 0; --fetch_rows在结果集中移动游标，如果未抵达末尾，返回1。
dbms_sql.column_value(v_cursor, 1, v_persionid);   --将当前行的查询结果写入上面定义的列中。
dbms_sql.column_value(v_cursor, 2, v_date);
dbms_output.put_line(v_persionid || ':' || v_date);
end loop;
end;

这个语句块中，关键是查询操作是采用拼接的sql命令并动态执行sql操作，其结果是通过语法分析无法准确地对需要脱敏的字段进行处理。

技术应对：即使采用了语法分析，这种动态sql语句也无法被处理；建议采用的策略是禁止这样的操作被执行。

trap5：where子句中包含敏感字段作为条件字段，脱敏还是不脱敏？

场景：用户配置了persionid字段为敏感字段，执行sql命令select persionid,datefield from performance_c_1000000 where persionid like '1204581978%';

该操作会面临一个问题：是否需要对where条件中的persionid字段（红色字体）进行脱敏处理？

如果脱敏处理，好处是不会造成通过准确查询进行数据的“猜测”引起的数据泄露；缺点是恐怕很难再通过脱敏字段作为条件进行查询。

如果不进行脱敏处理，好处是不影响查询操作，该查询到的数据依然能够查到；缺点是频繁查询很可能猜测到真实数据，导致数据存在泄漏风险。

技术应对：无论如何选择，都无法实现最佳效果，相对合理的k8凯发天生赢家的解决方案是两种都提供，然后根据实际的需求来配置合理的策略。

技术真正为用户铸造安全、可靠、高效的数据使用环境，基于网络层的动态脱敏技术为实时数据共享开辟了新的前景。

上一篇：市面上出现的两类数据库审计技术路线对比

下一篇：纵观加密算法的技术发展路线

试用申请
4000-258-365