数据匿名化对群体间差异的统计表征的影响  被引量:2

Implications of Data Anonymization on the Statistical Evidence of Disparity

在线阅读下载全文

作  者:许衡 张楠 顾洁(译) Heng Xu;Nan Zhang;GU Jie

机构地区:[1]美国美利坚大学科戈德商学院 [2]上海社会科学院信息研究所,200235

出  处:《国外社会科学前沿》2021年第10期60-75,共16页JOURNAL OF INTERNATIONAL SOCIAL SCIENCES

摘  要:近年来,学界和业界对以数据匿名化为代表的隐私保护技术的研发工作剧增。然而,围绕隐私保护如何影响针对弱势亚人群的数据洞察的研究却非常有限。本文尝试探索数据匿名化可以在多大程度上掩盖群体差异的统计表征。我们首先描述了数据匿名化的两种常见机制(数据移除与噪声插入)和群体差异的两类常见统计表征(隔离差异与变差差异),构建了相关的概念基础和数学表达;在此基础上,证明数据匿名化会掩盖群体差异,并进一步发现采用不同统计表征方式对差异进行操作化时,不同的数据匿名化机制将产生不同的影响。经验证据也验证了我们的理论推断。我们的研究发现具备商业价值和政策意义,强调企业和政策制定者需要在保护隐私和识别、纠正群体差异之间取得平衡。

关 键 词:隐私 数据匿名化 歧视 统计差异 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象