差分隐私的隐私观与隐私目标.pdf
《差分隐私的隐私观与隐私目标.pdf》由会员分享,可在线阅读,更多相关《差分隐私的隐私观与隐私目标.pdf(10页珍藏版)》请在咨信网上搜索。
1、2023 年 10 月 Chinese Journal of Network and Information Security October 2023 第 9 卷第 5 期 网络与信息安全学报 Vol.9 No.5 差分隐私的隐私观与隐私目标 贾靖宇1,2,谭畅1,2,刘哲伟2,3,李鑫豪2,3,刘哲理2,3,张涛4(1.南开大学计算机学院,天津 300350;2.南开大学数据与智能系统安全教育部重点实验室,天津 300350;3.南开大学网络空间安全学院,天津 300350;4.中国工程物理研究院激光聚变研究中心,四川 绵阳 621900)摘 要:为了解决差分隐私中“隐私目标”难以理解的问
2、题,研究差分隐私在多个领域中存在的隐私争议。从数据相关性场景的具体示例展开,研究学者对差分隐私保护目标的不同观点。当数据集中的记录具有相关性时,敌手能利用记录间相关性从差分隐私机制中准确推理用户的某些敏感信息。这种现象是否违反隐私保护,引起学者的长期讨论。借助法学领域的研究,调研计算机领域两种主流隐私理论对隐私定义的影响。限制访问个人信息理论强调阻止他人获取个人的敏感信息。该理论认为隐私机制应当阻止敌手通过获取用户的真实信息。对个人信息的控制理论则强调个人向他人传达有关自身信息的权利。该理论认为因他人分享数据的相关性,个人的信息泄露不应该被视为隐私泄露。分析计算机科学、社会科学、伦理道德以及人
3、机交互领域中学者对于隐私概念的不同理解而对差分隐私产生的争议。从多学科视角分析差分隐私的隐私观,帮助读者正确认识差分隐私的隐私观与隐私目标,并增进读者对“隐私”的理解。关键词:差分隐私;数据相关性;隐私风险;隐私理论 中图分类号:TP3-05 文献标志码:A DOI:10.11959/j.issn.2096109x.2023071 Privacy view and target of differential privacy JIA Jingyu1,2,TAN Chang1,2,LIU Zhewei2,3,LI Xinhao2,3,LIU Zheli2,3,ZHANG Tao4 1.Colle
4、ge of Computer Science,Nankai University,Tianjin 300350,China 2.Key Laboratory of Data and Intelligent System Security,Ministry of Education,Nankai University,Tianjin 300350,China 3.College of Cyber Science,Nankai University,Tianjin 300350,China 4.Laser Fusion Research Center,China Academy of Engine
5、ering Physics,Mianyang 621900,China Abstract:The study aimed to address the challenges in understanding the privacy goals of differential privacy by analyzing the privacy controversies surrounding it in various fields.It began with the example of data correlation and highlighted the differing perspe
6、ctives among scholars regarding the targets of privacy protection.In cases where records in a dataset were correlated,adversaries can exploit this correlation to infer sensitive information about individuals,thereby sparking a debate on whether this violates privacy protection.To investigate the inf
7、luence of privacy theories in the legal domain on defining privacy,two mainstream privacy theories in the computer field were 收稿日期:20221130;修回日期:20230331 通信作者:刘哲理, 基金项目:国家自然科学基金(62032012)Foundation Item:The National Natural Science Foundation of China(62032012)引用格式:贾靖宇,谭畅,刘哲伟,等.差分隐私的隐私观与隐私目标J.网络与信息安
8、全学报,2023,9(5):82-91.Citation Format:JIA J Y,TAN C,LIU Z W,et al.Privacy view and target of differential privacyJ.Chinese Journal of Net-work and Information Security,2023,9(5):82-91.第 5 期 贾靖宇等:差分隐私的隐私观与隐私目标 83 examined.The first theory,limited access to personal information,focuses on preventing oth
9、ers from accessing an individuals sensitive information.According to this theory,privacy mechanisms should aim to prevent adversaries from accessing a users actual information.In contrast,the second theory,control over personal information,emphasizes an individuals right to communicate personal info
10、rmation to others.This theory suggests that the disclosure of personal information due to the relevance of others sharing data should not be considered a breach of privacy.Then the controversies of differential privacy were analyzed in the fields of computer science,social science,ethics and human-c
11、omputer interaction due to their different understandings of privacy.By exploring the privacy concept of differential privacy from a multidisciplinary perspective,this study helps readers gain a correct understanding of the privacy viewpoint and goals of differential privacy while enhancing their un
12、derstanding of the concept of“privacy”itself.Keywords:differential privacy,data correlation,privacy risk,privacy theory 0 引言 数据已经成为当今社会上技术创新背后的关键驱动力,企业能够依靠海量数据提供更有竞争力的产品。因此,企业一直在促进各方共享数据以实现更大的商业以及社会价值。然而,数据隐私泄露事件的披露导致人们开始担心分析敏感数据的研究工作将对个人隐私造成的不利影响1-3。人们迫切需要在数据分享的过程中提供足够的隐私保护,以规避不必要的隐私风险。为了促进数据共享,研究人
13、员提出了差分隐私4-10(DP,differential privacy)的隐私保护概念。差分隐私是数据分析场景下隐私保护的黄金标准,在指导隐私算法的设计以及量化数据分析用户的隐私泄露水平任务中发挥着重要的作用。差分隐私要求隐私算法应当确保单个记录的变化几乎不会影响数据分析的结果。在这种情况下,敌手不太可能从差分隐私保护下的分析结果中识别单个用户的记录。因此,无论是用户还是企业在共享数据时,都不必过分担心数据共享行为对个人隐私造成太大的风险。随着差分隐私的迅速发展,一系列关于差分隐私保护目标的争论11-19开始出现。学者发现很难解释差分隐私在现实场景上提供的隐私保护效果。尽管差分隐私拥有严谨的
14、数学属性,能够在复杂的场景中量化隐私泄露,但差分隐私的量化指标并不直观,需要结合上下文来理解,这使得学者在差分隐私的保护目标与适用场景上产生了分歧。在数据存在相关性的场景中,差分隐私的争议引发了学术界对于隐私目标的大量讨论。2011年,Kifer 等12指出如果原始数据集的记录间存在相关性,差分隐私很难提供有实际意义的保护效果。一个拥有辅助信息的敌手能准确推理差分隐私保护的用户敏感信息。只有假设记录相互独立,差分隐私提供的保护才是有意义的。基于 Kifer等的研究,相当数量的学者认为如果数据间存在相关性,使用差分隐私算法会导致用户的隐私泄露20-28。对于这一问题,争论的关键并不在于技术,而是
15、如何正确理解“隐私”这一概念。在统计数据分析中,传统的隐私目标是在统计数据中学习用户特征的同时,防止敌手推理出某些个体的属性。然而,不断出现的隐私泄露事件表明,敌手总是能借助特定的辅助信息来有效地从统计信息中推理出一些个人属性。在任意背景知识的敌手下同时兼顾统计数据的效用和隐私是不现实的。相对应地,差分隐私假定无法阻止个人信息的泄露。但为了促进用户分享数据,差分隐私要求隐私保护技术在数据分析结果中提供一定的随机性以保证单个记录的变化不会对分析结果产生较大的影响。换句话讲,差分隐私保证即使出现隐私泄露的情况也与用户分享数据的行为无关。然而,差分隐私的隐私目标并不符合所有人对隐私的理解。学术界关于
16、隐私目标的争议与混淆开始阻碍差分隐私技术的发展。本文认为,提高用户对“隐私”概念的理解是一项很重要但往往被忽略的工作。在科研工作中,常常能看到“侵犯隐私”或者“隐私泄露”的描述,但学者往往没有对他们声称的“隐私”进行明确的定义。而学者对于隐私这一概念的理解,很可能会影响他们文章的立意。当隐私保护的目标与人们的84 网络与信息安全学报 第 9 卷 隐私观念冲突时,非技术的不可调和的矛盾就会出现。在提到隐私保护时,研究人员通常关注隐私算法的技术特征,而忽略这些隐私算法在“隐私”理解上可能存在的差异。而在现实场景中,作者的隐私观对隐私技术的落地有重要意义。为了解释差分隐私在学术界引发的一系列争议,并
17、帮助读者理解差分隐私的隐私观和隐私目标,本文总结关于差分隐私的一系列争议,并解释差分隐私场景下的隐私目标。同时,本文引入法学界对于“隐私”这一概念的长期讨论,增进读者对“隐私”概念的理解,并帮助读者正确理解差分隐私的隐私目标,从而正确地学习和使用差分隐私以及其他隐私保护技术。1 差分隐私 差分隐私是一种具有规范数学性质的隐私定义,它要求隐私算法在数据分析结果中提供足够的随机性以保护用户隐私。差分隐私承诺如果用户得到差分隐私算法的保护,用户所面临的隐私泄露风险与他们分享数据的行为无关。差分隐私认为,当敌手拥有足够的背景知识时,用户面临的信息泄露风险是不可避免的。但差分隐私通过为用户提供适当的保护
18、以降低数据分享与敏感信息泄露的关联性。1.1 差分隐私定义及相关概念 定义 1 差分隐私5。设0,0,1),如果输出域为 y 的隐私算法 M 满足(,)-差分隐私,那么对于任意相邻数据集(只有一条记录不同的两个数据集),nX X,以及任意的输出域Y ,均有 Pr()e Pr()M XYM XY 其中,参数e为自然常数。参数为隐私预算,指用户的数据在经过差分隐私算法保护后的隐私损失上界,该参数越大,则隐私算法的泄露风险越高。参数表示隐私损失超过参数约束的概率(通常被设置为一个可忽略的数值)。隐私算法M在相邻数据集,X X上的输出差异将被隐私参数(,)约束,当参数(,)较小时,()M X和()M
19、X的分布几乎相同,即单个记录的改变不会影响数据分析的结果。差分隐私不考虑敌手从算法输出得到的计算优势,而是度量算法本身的随机性。因此,只要差分隐私算法能够正确执行,用户就能得到对应的隐私保护,敌手的辅助信息不会破坏隐私保护的效果。接下来,本文给出全局灵敏度的定义。全局灵敏度指的是单条记录对查询函数的影响程度,它用于指导不同查询函数中差分隐私机制的噪声尺度。定义 2 全局灵敏度5。给定函数:nf dR,对于任意相邻数据集,nX X,查询函数f的全局灵敏度为 ,max|()()|pX Xff Xf X 其中,|p表示pl范数。下面介绍一种常用的差分隐私机制拉普拉斯机制。拉普拉斯机制通过在查询结果中
20、添加服从拉普拉斯分布的随机噪声提供差分隐私保护。定义 3 拉普拉斯机制5。对于任意查询函数:ndfR,以及任意数据集nX,拉普拉斯机制1()()(,)dM Xf X满足(,0)-差分隐私,其中i为服从拉普拉斯分布Lap(/)f的随机变量。以满足(1,0)-差分隐私的拉普拉斯机制为例:假设有一个计数查询任务,要求计算某药店某日的购药人数。为了保护用户的购药信息,药店使用拉普拉斯机制在查询结果中添加噪声。假设当日的购药人数为10,那么拉普拉斯机制在相邻数据集上的输出分布如图1中蓝线所示;而如果当日的购药人数为11,机制在相邻数据集上的输出分布则如图1中橙线所示。由于两个分布在任意结果上都有着相近的
21、输出概率,因此敌手很难准确推断当日的购药人数,从而保护用户隐私。图 1 拉普拉斯机制在相邻数据集上的输出分布 Figure 1 Distribution of the Laplace mechanism on neighboring datasets 第 5 期 贾靖宇等:差分隐私的隐私观与隐私目标 85 1.2 统计披露限制与差分隐私 数据分析的隐私保护问题跨越了多个学科。越来越详细的个人电子数据和不断发展的数据分析技术对数据的收集和管理提出了更高的要求。在差分隐私出现之前,隐私保护技术往往会对一个直观的隐私指标进行保护。以k-匿名化29为例,该技术要求发布的表格式数据集中相同的组合需要出现
22、至少k次。然而,如果原始数据集中记录缺乏多样性,敌手很容易通过统计结果推理出某个人的属性。由于缺少统一的设计标准,隐私算法很容易在不同背景知识的攻击者下遭到攻击。因此,学术界需要一个能够抵御任意背景知识敌手、有实际应用意义,并且有着严格数据性质的隐私定义来指导隐私保护技术的设计并量化隐私技术的保护效果。1977年,Dalenius30对统计数据库提出了个人隐私保护要求:除非能直接接触数据库,关于个人的任何信息都不应该从数据库的统计信息中学习。Dalenius的隐私目标也被称为经典的统计披露限制。统计披露限制认为,如果敌手能从统计信息中学习到关于个人的部分信息,统计数据库就是不隐私的。类似的安全
23、性定义常见于现代密码学,但很难匹配一些数据分析的实际需求。在2008年的一项研究中,Dwork31用一个简单的例子指出统计披露限制的困境:假设数据库能计算不同地区女性的平均身高。只要敌手有特定的辅助信息,统计披露限制的隐私目标就几乎不可能实现,除非统计结果中几乎不包含任何有用的信息。1.3 差分隐私的隐私观 由于敌手辅助信息的存在,合理限制敌手的推理能力并提供有意义的隐私保护是较为困难的。同时,如果希望限制敌手辅助信息的类型,如何界定敌手的辅助信息是否合理就会成为一个困难的问题。为了提出一个合理的隐私定义,差分隐私选择对“隐私”进行狭义解释,通过降低隐私保护的标准而避免出现上述问题5。差分隐私
24、中,用户只应当对他们能控制的行为要求隐私保护。因此,差分隐私的目标是合理量化用户分享数据的这一行为可能导致的隐私泄露。差分隐私限制分享数据导致的信息泄露,而不限制实际敌手推理导致的数据泄露程度,因此它并不需要对敌手的辅助信息进行假设。作为一个对隐私机制随机性的量化标准,差分隐私自然地抵御任意背景知识敌手。即使敌手拥有任意的背景知识,能以极高的概率从数据分析中推理用户的真实信息,也并不影响差分隐私的保证。2 差分隐私的争议 差分隐私对“隐私”概念的狭义解释使得它面对任意背景知识敌手都能稳定地量化用户的隐私泄露。由于其规范的数学属性,以及能抵御任意敌手的强鲁棒性,差分隐私在敏感信息收集、数据库隐私
25、保护、医疗数据分析、机器学习隐私保护等场景得到了广泛应用。然而,一些研究表明差分隐私算法可能无法提供足够的隐私12,20-28。Kifer20认为,差分隐私模糊了人们隐私需求中试图保护的内容。具体来讲,差分隐私只保护个人记录在数据集中的变化所造成的影响,但实际上,它并不能完全防止敌手从数据分析任务能推理出个人信息,而这一点往往与人们对隐私的直观理解不符。本文借助数据具有相关性的场景中差分隐私的争议来解释差分隐私可能存在的隐私问题。2.1 差分隐私与数据相关性 本文通过传染病信息发布案例来解释差分隐私的保护目标以及学者争议的焦点。差分隐私数据发布示意如图2所示,展示了用户敏感信息在数据收集与发布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 隐私 目标
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。