Kif Google tanonimizza d-dejta
L-anonimizzazzjoni hi teknika ta' pproċessar tad-dejta li tneħħi jew timmodifika informazzjoni personalment identifikabbli; tirriżulta f'dejta anonimizzata li ma tistax tiġi assoċjata ma' xi individwu. Hi komponent kritiku wkoll tal-impenn ta' Google għall-privatezza.
Billi nanalizzaw dejta anonimizzata, nistgħu nibnu prodotti u karatteristiċi sikuri u siewja, bħall-kompletazzjoni awtomatika ta' talba għat-tiftix imdaħħla, u niskopru aħjar it-theddid għas-sigurtà, bħal siti ta' phishing u malware, dan kollu filwaqt li nipproteġu l-identitajiet tal-utenti. Nistgħu wkoll naqsmu b'mod sikur dejta anonimizzata esternament, u nagħmluha utli għal oħrajn mingħajr ma npoġġu l-privatezza tal-utenti tagħna f'riskju.
Tnejn mit-tekniki li nużaw biex nipproteġu d-dejta tiegħek
Ġeneralizzazzjoni tad-dejta
Hemm ċerti elementi tad-dejta li huma konnessi aktar faċilment ma' ċerti individwi. Biex jiġu protetti dawk l-individwi, nużaw il-ġeneralizzazzjoni biex ineħħu parti mid-dejta jew inbiddlu parti minnha ma' valur komuni. Pereżempju, nistgħu nużaw il-ġeneralizzazzjoni biex inbiddlu segmenti ta' kodiċijiet taż-żona jew numri tat-telefown kollha mal-istess sekwenza ta' numri.
Il-ġeneralizzazzjoni tippermettilna niksbu anonimità-k, terminu standard tal-industrija użat biex jiddeskrivi teknika għall-ħabi tal-identità ta' individwi fi grupp ta' persuni simili. Fl-anonimità-k, il-k hija numru li jirrappreżenta d-daqs ta' grupp. Jekk għal xi individwu fis-sett tad-dejta, hemm mill-inqas individwi k-1 li għandhom l-istess proprjetajiet, allura ksibna anonimità-k għas-sett tad-dejta. Pereżempju, immaġina ċertu sett ta' dejta fejn k hija ugwali għal 50 u l-proprjetà hija kodiċi postali. Jekk nanalizzaw kwalunkwe persuna f'dak is-sett tad-dejta, insibu dejjem 49 oħra bl-istess kodiċi postali. Għalhekk, ma nkunux nistgħu nidentifikaw xi persuna partikolari mill-kodiċi postali tagħha biss.
Jekk l-individwi kollha f'sett tad-dejta jaqsmu l-istess valur ta' attribut sensittiv, informazzjoni sensittiva tista' tiġi żvelata sempliċement billi wieħed ikun jaf li dawn l-individwi huma parti mis-sett tad-dejta inkwistjoni. Biex jittaffa dan ir-riskju, nistgħu nisfruttaw d-diversità-l, (l-diversity) terminu standard tal-industrija użat biex jiddeskrivi xi livell ta' diversità fil-valuri sensittivi. Pereżempju, immaġina grupp ta' nies fittxew għall-istess suġġett sensittiv tas-saħħa (eż. sintomi tal-influwenza) ilkoll fl-istess ħin. Jekk nanalizzaw dan is-sett tad-dejta, ma nkunux nistgħu ngħidu min fittex is-suġġett, grazzi għall-anonimità-k (k-anonymity). Madankollu, xorta jista' jkun hemm tħassib dwar il-privatezza peress li kulħadd jaqsam attribut sensittiv (jiġifieri s-suġġett tat-talba). Diversità-l tfisser li s-sett tad-dejta anonimizzat ma jkunx fih biss tfittxijiet dwar l-influwenza. Pjuttost, jista' jinkludi tfittxijiet oħra flimkien mat-tfittxijiet dwar l-influwenza biex tiġi protetta aktar il-privatezza tal-utent.
Żieda ta' elementi bla sens mad-dejta
Il-privatezza differenzjali (anke terminu standard tal-industrija) tiddeskrivi teknika għaż-żieda ta' informazzjoni matematika żejda mad-dejta. Bil-privatezza differenzjali, huwa diffiċli li jiġi aċċertat jekk xi individwu huwiex parti minn sett ta' dejta minħabba li l-output ta' algoritmu partikolari se jidher essenzjalment l-istess, irrispettivament minn jekk l-informazzjoni ta' xi individwu hijiex inkluża jew titħalliex barra. Pereżempju, immaġina li qed inkejlu x-xejra ġenerali fit-tfittxijiet għall-influwenza madwar reġjun ġeografiku. Biex tinkiseb privatezza differenzjali, inżidu informazzjoni żejda mas-sett tad-dejta. Dan ifisser li nistgħu nżidu jew innaqqsu n-numru ta' nies li qed ifittxu għall-influwenza f'xi nħawwi partikolari, iżda jekk nagħmlu hekk, dan ma jaffettwax il-kejl tagħna tax-xejra fir-reġjun ġeografiku usa'. Huwa importanti wkoll li wieħed jinnota li ż-żieda ta' informazzjoni żejda ma' sett ta' dejta tista' tagħmlu inqas utli.
L-anonimizzazzjoni hi biss wieħed mill-proċessi li aħna nużaw biex inżommu l-impenn tagħna għall-privatezza tal-utenti. Proċessi oħra jinkludu kontrolli stretti fuq l-aċċess għad-dejta tal-utenti, politiki biex nikkontrollaw u nillimitaw it-tgħaqqid ta' settijiet tad-dejta li jistgħu jidentifikaw lill-utenti, u r-rieżami ċentralizzat tal-istrateġiji ta' anonimizzazzjoni u ta' governanza tad-dejta biex niżguraw livell konsistenti ta' protezzjoni madwar Google fis-sħuħija tagħha.