中新網(wǎng)北京1月26日電 (記者 孫自法)匿名數(shù)據(jù)一定匿名嗎?施普林格·自然旗下學術(shù)期刊《自然-通訊》最新發(fā)表一篇技術(shù)論文指出,匿名數(shù)據(jù)也不那么匿名——人際互動數(shù)據(jù)或可長期用來識別匿名數(shù)據(jù)集中個體的身份。
該論文稱,為了開展服務(wù)或出于研究目的,短信應(yīng)用、手機運營商、社交媒體平臺和其他應(yīng)用都會收集細粒度的互動數(shù)據(jù)。這些數(shù)據(jù)已被用來研究個體間的互動模式,預(yù)測流行病的空間傳播,以及評估友情對政治動員的影響。根據(jù)歐盟當前的數(shù)據(jù)保護條例,這些數(shù)據(jù)無需征得用戶同意就能分享和出售,但前提是數(shù)據(jù)必須匿名。
論文通訊作者、英國倫敦帝國理工學院伊夫·亞歷山大·德蒙喬伊(Yves-Alexandre de Montjoye)和同事研究發(fā)現(xiàn),人們的互動數(shù)據(jù)能保持長期穩(wěn)定,這或許能用來識別匿名數(shù)據(jù)集中個體的身份。他們開發(fā)出一款基于深度學習的模型,訓練這個模型根據(jù)個體的互動網(wǎng)絡(luò)來識別他們的身份,并應(yīng)用于一個在不同時期收集信息的逾4萬人的數(shù)據(jù)集。該模型能基于個體的2級(2-hop)互動網(wǎng)絡(luò)(與目標個體相隔1人的個體互動)識別出52%的人,基于個體的直接(1級)互動網(wǎng)絡(luò)識別出15%的人。
由于這類互動網(wǎng)絡(luò)能保持長期穩(wěn)定,研究者在20周后還能用個體的2級互動網(wǎng)絡(luò)識別出24%的人。當研究者將該模型用于一個587人的藍牙近距離數(shù)據(jù)集時,該模型可以識別出超過26%的人。但論文作者也指出,他們不認為該模型適用于針對防疫的接觸者追蹤協(xié)議,比如谷歌和蘋果的暴露通知(Exposure Notification)。
論文作者認為,這項研究結(jié)果表明,匿名化、非連接互動數(shù)據(jù)或具有長期可識別性,這可能對隱私保護條例的遵守具有啟示意義。他們認為,接入控制和隱私增強系統(tǒng)這類安全措施或能防止這種個人身份被識別的情況發(fā)生。此外,該研究結(jié)果還顯示,處理這類數(shù)據(jù)的現(xiàn)行做法可能并不符合歐盟《通用數(shù)據(jù)保護條例》(GDPR)的匿名化標準。(完)
關(guān)鍵詞: 谷歌 互動網(wǎng)絡(luò) 通用數(shù)據(jù)保護條例 論文作者 自然-通訊
關(guān)于我們 廣告服務(wù) 手機版 投訴文章:39 60 2 914 2@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:39 60 2 914 2@qq.com