首页 > 科技 >

“匿名”数据不匿名:大数据时代,我们还有隐私吗?

2018-07-29 19:23:16 网络整理 阅读:106 评论:0

2016年8月,澳大利亚政府发布了由医疗账单记录组成的“匿名数据集,其中包括290万人的所有处方和手术。

为了保护个人隐私,记录中不包含姓名和其他身份信息。然而,墨尔本大学的一支研究团队马上发现,只要比对该数据集和其他公开信息,比如明星生孩子或者运动员做手术的新闻报道,人们的身份信息很容易重新识别,无需经过当事人同意就能获取完整医疗记录。

后来,政府从其网站上移除了这些数据——但此前已经被下载了1,500次。

看似无害的“去身份化”数据被逆向还原,身份信息由此曝光,这样的例子数不胜数,澳大利亚的那场隐私噩梦就是其中之一。而且,情况只会愈发恶化,因为人们在网上花费的时间越来越多,到处抛撒数字碎片,而这些可以被追溯的数字碎片会以意想不到的方式侵犯人们的隐私。

数字碎片可以被追溯,以意想不到的方式侵犯人们的隐私

有人将匿名的纽约出租车日志与狗仔队在该市多处拍摄的照片比对,发现好莱坞大明星布拉德利·库珀和杰西卡·阿尔芭居然没有付小费。2017年,德国研究人员根据“匿名的”网络浏览模式,成功发现人们的身份。近日,伦敦大学学院研究人员演示了如何根据推文的元数据,确认Twitter用户的身份。而健身追踪应用Polar暴露了士兵和间谍的家庭住址,甚至是名字。

“人们自欺欺人地以为身份信息难以重新识别,但实际上不难。我们做的那些事情,数据科学一年级新生就可以做到,”发现澳大利亚医疗公开数据漏洞的墨尔本大学研究团队成员凡妮莎·提格(Vanessa Teague)说。

这类隐私侵犯的一个最早例子发生在1996年。当时,美国马萨诸塞州团体保险..发布了该州政府职员到医院就诊的“匿名”数据。和澳大利亚政府的做法一样,马萨诸塞州政府删除了明显的身份信息,比如姓名、住址和社保号码。州长威廉·威尔德(William Weld)向公众保证,病人的隐私得到了保护。

相关文章