首页 > 科技 >

“匿名”数据不匿名:大数据时代,我们还有隐私吗?(2)

2018-07-29 19:23:16 网络整理 阅读:106 评论:0

后来成为美国联邦贸易..首席技术官的计算机科学毕业生拉坦娅·斯威妮(Latanya Sweeney)从数据集中找出了威尔德的医疗记录,以事实证明他的话错得有多离谱。斯威妮从选民名册中获取威尔德的邮政编码和出生日期,并利用某一天他在公共仪式上晕倒后送医的报道,锁定了他的身份。斯威妮把威尔德的医疗记录发到了他的办公室。

斯威妮在后来的研究中发现,只需要根据出生日期、性别和五位数邮政编码,就可以对美国87%的人口进行唯一身份识别。

“看似匿名的数据未必是匿名的,”她向国土安全部隐私..作证时说。

后来,计算隐私研究员伊夫-亚历山大·德蒙鸠耶(Yves-Alexandre de Montjoye)证明,根据手机位置数据揭示的行为模式,就能识别大多数人的身份。通过分析15个月时间内150万人(没有其他的身份信息)的手机大致位置(根据最近的信号塔),仅仅依靠地点和时间的四个数据点,就可能对95%的人进行唯一身份识别;只需要两个数据点,就可以识别大约50%的人。

那四个数据点来自于公开可用的信息,包括个人的家庭住址、工作地点和标记了地理位置的推文。

“位置数据相当于指纹。这些信息可能存在于广泛的数据集中,可作为全局标识符,”德蒙鸠耶说。

对于有固定工作的人来说尤其如此,,而这简直是跟踪狂的美梦!

“你从家到工作场所,下班后再返回家中,相当有规律。大多数人在地址A居住,在地址B上班,”Salinger Privacy咨询公司董事安娜·约翰斯顿(Anna Johnston)说。

她解释道,位置数据即使没有暴露个人的身份,也能使特定人群处于危险境地。例如,健身应用Strava发布的公共地图不经意地威胁到了国家安全,因为它揭示了秘密军事基地里的人员位置和活动情况。

相关文章