德蒙鸠耶在2015年证明,只需要知道某个信用卡用户的几次购买交易,就可能从数百万条“匿名的”收费记录中识别那人的身份。
只要掌握了发生交易的商店名称和位置,以及大致日期和购买数量,德蒙鸠耶就能仅仅通过三次交易,对94%的人进行身份识别。这意味着某人可以寻找你和朋友一起喝咖啡的Instagram照片、关于最近一次购物交易的推文和一张陈旧的收据,就能将这些信息与你的整个购买历史记录匹配起来。
社交媒体上的一张照片就可能暴露你的整个交易历史记录
德蒙鸠耶和其他人已经一再证明,以记录归档为目的的数据(与个人有关的数据)不可能做到完全匿名,无论那些数据被简化到什么程度。
“以前可能有效,但现在不行了,”他说。
至于如何防止这种隐私侵犯,个人能做的其实很少。
“一旦我们的数据流传出去,往往会被永久保存,”普林斯顿大学计算机科学教授阿文德•纳拉亚南(Arvind Narayanan)说,“有些公司专门整合不同来源的个人数据,建立虚拟档案,并利用数据挖掘技术,以各种方式来影响我们。”
抛弃手机、只用现金付款,确实有助于减少你留下的个人数字碎片,但这样做并不现实。
“你如果想融入社会,就无法将你流传出去的个人数据量限制到一个有意义的水平,”安全研究员克里斯·维克里(Chris Vickery)说。
而且,个人还很难就软件和服务收集数据的方式作出知情同意。如果很容易重新识别某人的身份,那么企业不共享个人身份信息的承诺是毫无意义的。
“关键是好的法律和恰当的执法,”德蒙鸠耶说。他表示,欧盟的《通用数据保护条例》是“朝正确方向迈出的一步”。
“隐私法的一个缺陷在于,让无法充分了解风险的消费者承担太多的责任,”约翰斯顿说,“应该让数据保管人(比如政府、研究人员和企业)承担更多的法律责任。”
但德蒙鸠耶依然乐观。他说大数据“潜力巨大”,对医学研究和社会科学尤其有好处。
他建议,研究人员和政府不应该公布庞大的数据集,而是应该开发接口,允许其他人在不直接访问原始数据的前提下就数据提出需求。
“背后的想法是不失去对数据的管控,确保对象保持匿名状态,”他说。
“隐私未死。我们需要它,隐私终将得到保护。”
翻译:于波
校对:李莉
造就:剧院式的线下演讲..,发现最有创造力的思想