Differential privacy – Apple vs Google

Jeg har lenge hatt lyst til å beskrive Apples metodikk for å analysere kundedata og sammenligne den med Googles. Apple har tatt et klart steg mot å beskytte brukernes personvern gjennom å benytte en metode kalt differential privact, mens Google i de fleste tilfeller anonymiserer kundedataen for sikre brukerens personvern. Disse to metodene bygger på de to selskapenes ulike strategiske inntektsretning fremover: Apple mot abonnement- og tjenesteinntekter mot Googles annonseinntekter. Men hva betyr Apples valg av differential privacy for personvern og Apples forskning innen AI?

Differential privacy

eller differensial personvern om du vil, er enkelt forklart at man legger til støy i datagrunnlaget man innhenter fra et stort antall individer eller datapunkter. Det vil si at for hver gang man ønsker å gjøre en spørring eller hente ut informasjon om datagrunnlaget, vil algoritmer legge til støy som eksempelvis kan være falsk data som gjør at datagrunnlaget er såpass  mer generelt og ikke kan spores ned til den enkelte bruker. Differential privacy handler om å hente inn data, men ikke din data. En god billedlig forklaring kommer i bildet under:

Kilde: Staff Reports, Wall Street Journal

Om noen ønsker å finne linker i datagrunnlaget vil de aldri kunne determinere om én person/entitet svarte på dette spørsmålet. Slik kan forskere analysere sensitiv data og se trender i datagrunnlaget, uten å kunne linke trendene mot spesifikke individer.

Fint, men hvorfor gjør ikke alle det slik?

De fleste andre selskaper benytter seg av anonymisert data. Utfordringen med anonymisert data er at teknikken som benyttes for å anynomiseres kan (ofte) reverseres, det vil si at nøkkelen til anonymiteten er lagret et sted og dermed er sårbar for hacking eller andre feil som i verste fall avsløre identiteten til personen bak. Med differential privacy er ikke dette mulig, på grunn av støyen som blandes inn i datagrunnlaget. Dette gjør igjen det vanskelig for Google å benytte differential privacy, fordi de er avhengig av å kunne knytte dataen de lærer om deg til å servere deg personlige annonser – og i tillegg lære mest mulig om hver enkelt brukere for å personalisere tjenestene. Apple må ta den lengre veien å lære mønstre fra brukerne, noe som igjen skaper hindre i deres kunstig intelligens forskning. Kunstig intelligens handler oftest om å lære mest mulig av datagrunnlaget man blir gitt, og som fortrinnsvis stadig vokser som kan videre gi økt læring. Den enkleste og direkte måten for å bygge smarte nye tjenester på er å benytte seg av kundenes data, og å bruke store mengder av denne dataen til å trene tjenestene til å bli bedre. Ved at Apple har valgt en strengere retning innen personvern, gjør at de må gå en rekke lengre veier for å oppnå samme ytelse og presisjon. Det blir spennende å se hvorvidt Apple klarer å henge med i kunstig intelligens racet fremover og tilby brukerne de personlige tjenestene og funksjonene konkurrentene kan levere, eller å velger et suboptimalt produkt som har et høyere nivå av personvern.

Please follow and like us:

Leave a Reply

Your email address will not be published. Required fields are marked *