Direkte til sidens indhold

Radar er blevet en del af Teknologiens Mediehus

...og bliver en del af PLUS-abonnement i løbet af et par måneder. Du har fortsat adgang til indholdet, ved at registrere dig her. Vi kontakter dig med et gratis og uforpligtende prøveabonnementstilbud ved lancering.

    Sundhedsdatastyrelsen er klar til at afprøve syntetisk data

    Sundhedsdatastyrelsen vil forsøge at lave syntetisk data ud af vores almindelige sundhedsdata til brug for erhvervsliv og andre. Det kan løse privatlivsproblemer, mener flere eksperter.

    Vicedirektør i Sundhedsdatastyrelsen, Vibeke van der Sprong. (pressefoto)

    Anonymisering er altid et helt centralt element, når myndigheder og forskere skal arbejde med sundhedsdata.

    Da den daværende S-regering i sin life science-strategi erklærede, at de unikke danske sundhedsregistre skulle danne basis for et nyt eksporteventyr, kunne der anes nervøse trækninger hos privatlivsaktivister.

    Den nye SVM-regering lover i regeringsgrundlaget, at den vil udarbejde en ny life science-strategi, da den nuværende udløber i år. Der er også en plan for personlig medicin i støbeskeen, og begge vil efter alt at dømme afkræve nye svar på, hvor grænserne går for, hvordan danskernes sundhedsdata kan anvendes i kommercielle sammenhænge og til innovation. Den daværende regering barslede også med tanker om nye samtykker, hvor borgerne i højere grad kan angive, hvad deres data må bruges til.

    Hos Sundhedsdatastyrelsen ser vicedirektør Vibeke van der Sprong store muligheder i syntetisk data. Med det vil man kunne arbejde med store datasæt af høj kvalitet uden at kompromittere beskyttelsen af danskernes private data eller komme i karambolage med GDPR. Virksomheder eller andre myndigheder ville i så fald kunne få udleveret syntetiske data, og de reelle data forbliver i sundhedsmyndighedernes registre.

    – Der er ingen tvivl om, at der er et stort potentiale, da du får data, som er meget tæt på virkelighedens data, hvor beskyttelsen af personhenførbare data er håndteret og sikret. Det kan åbne for, at vi nemmere vil kunne udlevere data til eksempelvis innovation og kommercielle formål, men forudsætningen er beskyttelsen af data, siger hun.

    Forsøg på vej

    Konkret har Sundhedsdatastyrelsen et idéforslag med syntetisk data i støbeskeen, men Vibeke van der Sprong har endnu ikke finansieringen helt på plads.

    – Med udgangspunkt i de sundhedsdata vi har, så vil vi forsøge at gøre dem syntetiske. Vi skal undersøge træfsikkerheden, og så skal vi se på hvilke kompetencer, vi skal opbygge for at kunne bruge syntetisk data. På AI-siden får vi brug for eksterne kompetencer, siger hun.

    Dermed følger Sundhedsdatastyrelsen i kølvandet på blandt andet Styrelsen for Arbejdsmarked og Rekruttering (STAR), Region Sjælland og Danmarks Statistik, der også eksperimenterer med syntetisk data.

    Thomas Hildebrandt, der er professor i software engineering og forskningsleder på Københavns Universitet, mener at det giver god mening at bruge syntetisk data til at løse forskellige privatlivsproblemer i forhold til sundhedsdata.

    – Så kan man beholde den personfølsomme data på hospitalerne. Og hvis man ellers kan finde algoritmer, der virker i forhold til privacy og kvalitet, så kan man syntetisere data og udlevere den til anden brug, siger han.

    Når forskere eller eksperter udvikler syntetisk data, så forurener de i princippet det oprindelige datasæt eller lægger såkaldt støj ind, så det ikke længere er muligt at identificere den enkelte borger. Det er så muligt at arbejde med, hvor lille en gruppestørrelse, data skal kunne snævres ind til. Og den syntetiske data kan yderligere trænes, så man forsøger at korrigere for fejl. Fordelen er så, at du sidder tilbage med syntetisk data, der i høj grad ligner den virkelige data – uden privatlivsproblemer.

    – Bare at anonymisere virker ikke. Det positive her er, at dataen har næsten de samme statistiske egenskaber, siger Thomas Hildebrandt, der selv eksperimenterer med syntetisk data.

    Skeptisk forening

    Jesper Lund, formand for It-Politisk Forening, anerkender, at det teknisk kan lade sig gøre at lave syntetisk data, hvor det er umuligt at identificere den enkelte borger eller patient. Men han er grundlæggende skeptisk over for at bruge danskernes sundhedsdata til andet end forskning.

    – At bruge sundhedsdata til forskning er et nobelt formål. Men at sætte sundhedsdata fri til kommercielle formål rejser nogle seriøse samfundsproblematikker. Der udestår en grundlæggende diskussion af, om vi overhovedet skal bruge det til andet end forskning. Og så er der muligvis også nogle muligheder for at identificere folk på gruppeniveau og i forhold til specifikke sammenhænge, siger han.

    Hos Datatilsynet mener it-sikkerhedsspecialist Allan Frank, at syntetiske data åbner for nogle spændende muligheder.

    – Reelt syntetiske data, der er anonyme, altså uden mulighed for at henføre til en given fysisk person, vil være en kæmpe gevinst for databeskyttelsen, siger han og tilføjer:

    – Dels er disse – definitorisk – slet ikke omfattet af databeskyttelsesreglerne, og dels vil det kunne afhjælpe sikkerheden i de testscenarier, der i dag benytter produktionsdata. Problemet indtil videre har dog ofte været, at flere metoder til skabelse af syntetiske data, har kunnet reverseres til de oprindelige persondata.

    Kommentar: Hvor ender TikTok-konflikten? Meget taler for et salg…
    Big Tech

    Kommentar: Hvor ender TikTok-konflikten? Meget taler for et salg…

    TikTok står efterhånden i en situation, hvor det ligner et historisk fald i værdi, hvis USA indfører et forbud mod platformen. Så hvis ikke Bytedance skal se sit kæreste eje blive til værdiløs kode på historiens store app-mødding, så peger meget på et frasalg…