Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.

Anonymisaasje software

It algoritme yn 'e software herkent en anonymisearret persoanlike gegevens en oare gefoelige ynformaasje yn dokuminten. Oerheden publisearje geregeld ynformaasje oer de formulearring en útfiering fan harren belied (bygelyks op grûn fan de Woo). Dit ark wurdt brûkt om gefoelige gegevens net werkenber te meitsjen.

Lêst feroare op 9 jannewaris 2025 om 9:23 | Publikaasjestandaard 1.0
Publicatiecategorie
Oare algoritmes
Impacttoetsen
DPIA
Status
Yn gebrûk

Algemene ynformaasje

Tema

Organisaasje en bedriuwsfiering

Begjindatum

2025-01

Kontaktgegevens

privacy@hdsr.nl

Link nei publykspagina

Anonimiseren - xxllnc

Ferantwurde gebrûk

Doel en impact

It anonimisearringsark wurdt brûkt om transparânsje te garandearjen en tagelyk partikulieren, bedriuwen en ynstellingen te beskermjen.


It ark lit de organisaasje ynformaasje diele neffens regeljouwing lykas de Woo, sawol aktyf as passyf. Dit helpt de persoanlike gegevens fan de belutsenen te beskermjen. Dat jildt ek foar de beskerming fan privacygegevens fan de meiwurkers fan de organisaasje sels.


Oanfregers fan in Woo-fersyk krije de frege ynformaasje, anonymisearre of foar in part maskere neffens oare regeljouwing. Foar de ôfdielingen dy't ferantwurdlik binne foar it behanneljen fan Woo-oanfragen, makket it ark it neilibjen fan wetten en regeljouwing makliker en ferkoartet omlooptiden, sadat ynformaasje binnen de wetlike deadlines levere wurde kin.


De risiko-ynfloed fan it algoritme is leech foar partikulieren en organisaasjes. It algoritme siket nei (persoanlike) gegevens en markearret of maskearret dy, sûnder automatysk besluten te nimmen. In fakekspert beoardielet de anonimisaasjefoarstellen.


It ark biedt ek de opsje om ynformaasje te maskeren dy't net iepenbier makke wurde kin, lykas strategyske ynformaasje om de organisaasje of partners te beskermjen. De basis foar anonymisaasje of maskering wurdt oanjûn troch it ark.

Afwagings

Soms kinne bepaalde tekstfragminten yn dokuminten dy't iepenbier makke wurde net mei it publyk dield wurde. De Woo jout dêr útgongspunten foar, lykas de General Data Protection Regulation (GDPR).


Sûnder ark soe anonymisearjen fan teksten in protte tiid nimme en it risiko fan flaters ferheegje, wat liede kin ta net winske publikaasje fan gefoelige gegevens. It brûken fan in anonimisearringsark fersnelt en ferienfâldiget dit proses foar sawol aktive as passive iepenbiering.


Automatisearre anonymisaasje is minder flaterberich dan hânwurk. Dêrtroch is de kâns op gegevenslekken lytser en wurde persoanlike gegevens better beskerme.

Minskele tuskenkomst

Minsklike yntervinsje is altyd in eask by it brûken fan de software. Dat betsjut dat kontrôles altyd wurde útfierd troch meiwurkers. De organisaasje hat in ûntwerpdokumint opsteld. Dit lit de organisaasje it gebrûk fan algoritmen oanpasse oan har spesifike situaasje. In spesjalist beoardielet útstellen foar anonymisearjen fan teksten. Gjin automatyske besluten wurde makke.


It algoritme siket nei (persoanlike) gegevens en markearret dy. De fakspesjalist kontrolearret en korrizjeart de foarstellen. Dit wurk kin mooglik wurde kontrolearre troch in twadde persoan binnen it ark. Dit foldocht oan de eask fan 'minsklike yngripen'.

Risikobehear

Om foar te kommen dat dokuminten goed anonymisearre wurde, fynt altyd in minsklike kontrôle plak. De software kin yntuïtyf brûkt wurde foar kontrolearjen, wizigingen of tafoegings. Sûnder minsklike kontrôle kinne risiko's ûntstean, lykas it iepenbierjen fan privacygefoelige gegevens. De kombinaasje fan it ark en minsklike kontrôle helpt dit te foarkommen.


Skeining fan privacywetjouwing:

It ûnbedoeld iepenbierjen fan persoanlike gegevens kin privacywetten skeine, lykas de GDPR yn 'e EU. Dit kin liede ta wichtige boetes en juridyske sanksjes.


Identiteitsstellerij:

As persoanlik identifisearbere ynformaasje (PII) lykas nammen, adressen en nûmers fan sosjale feiligens wurde iepenbiere, kin it liede ta identiteitsstellerij en finansjele fraude.


Skea oan reputaasje:

Sawol de reputaasje fan 'e persoanen waans ynformaasje is útlekt as dy fan' e organisaasje dy't ferantwurdlik is foar it lek koe serieus skea wurde.


Ferlies fan fertrouwen:

It fertrouwen fan publyk en belanghawwenden yn 'e organisaasje kin ôfnimme, wat liedt ta in delgong yn ynset en stipe.


Persoanlike skea:

Partikulieren kinne emosjonele en psychologyske skea lije as har persoanlike ynformaasje, lykas medyske of finansjele ynformaasje, iepenbier makke wurdt.


Eksploitaasje en misbrûk:

Offisjele gegevens kinne brûkt wurde foar kweade doelen, lykas stakingen, yntimidaasje of diskriminaasje.


Minsklike resinsje helpt om dizze risiko's te ferminderjen troch in ekstra laach fan resinsje en befêstiging te leverjen. Der wurdt dan kontrolearre oft de anonymisaasjeprosessen goed útfierd binne foardat ynformaasje iepenbier wurdt.

Wettlike basis

  • General Data Protection Regulation (GDPR)
  • Miljeu wet
  • Algemene Wet bestuursrecht (AWB)
  • Wet op iepenbiering
  • Open Government Act (WOO)
  • Electronic Publications Act (WEP)

Links nei wettlike basis

  • AVG: https://wetten.overheid.nl/BWBR0040940
  • Omgevingswet: https://wetten.overheid.nl/BWBR0037885
  • AWB: https://wetten.overheid.nl/BWBR0005537
  • Bekendmakingswet: https://wetten.overheid.nl/BWBR0004287
  • Wet Open Overheid (WOO): https://wetten.overheid.nl/BWBR0045754
  • Wet Elektronische Publicaties (WEP): https://wetten.overheid.nl/BWBR0043961

Impacttoetsen

Data Protection Impact Assessment (DPIA)

Wurking

Gegevens

Alle ynformaasje fûn yn 'e uploaded dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. It kin gean om gewoane persoanlike gegevens, bysûndere persoanlike gegevens en strafrjochtlike gegevens. It kin ek gean om saaklike gefoelige ynformaasje.

Technyske wurking

Dokuminten wurde opladen nei de applikaasje troch in meiwurker. Op dat stuit wurdt in kopy fan it orizjineel makke as in tekst-overlay PDF en wurde de metadata fan it orizjinele dokumint fan 'e kopy fuortsmiten. Dit eksimplaar komt telâne op in Nederlânske server en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt oanbean oan it masine-learalgoritme fia in API. It giet om in Natural Language Processing-algoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje yn 'e analysearre teksten werom wêr't persoanlike gegevens wierskynlik foarkomme, tegearre mei de kânsskoare (in persintaazje). Op dat stuit wurdt de tekstlaach fuortdaliks wiske fan Azure. De kânsskoare wurdt tegearre mei de eigen AI-modellen fan de leveransier brûkt om persoanlike gegevens sa sekuer mooglik te werkennen. De modellen wurde oplaat mei de folgjende trained datasets lykas CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall en UD Dutch Alpino v2.8. Minimum kaai sifers foar de krektens fan it fêststellen fan persoanlike gegevens binne as folget: Named entiteiten (precision): 0,78, Named entiteiten (recall): 0,76, Named entiteiten (F-score): 0,77 Ta beslút, in meiwurker kontrolearret it dokumint en wannear it dokumint is foltôge, de te anonymisearjen gegevens wurde permanint fuortsmiten fan 'e tekstlaach en in swarte balke wurdt pleatst.

Leveransier

DataMask BV

Soartgelikense algoritme beskriuwingen

  • It algoritme yn 'e software herkent en anonymisearret persoanlike gegevens en oare gefoelige ynformaasje yn dokuminten. Oerheden publisearje geregeld ynformaasje oer de formulearring en útfiering fan harren belied (bygelyks op grûn fan de Woo). Dit ark wurdt brûkt om gefoelige gegevens net werkenber te meitsjen.

    Lêst feroare op 20 novimber 2024 om 14:27 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA
    Status
    Yn gebrûk
  • It algoritme herkent en anonymisearret (persoanlike) gegevens en fertroulike (finansjele) gegevens yn dokuminten foardat se publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer.

    Lêst feroare op 4 april 2024 om 9:22 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • It algoritme herkent en anonymisearret (persoanlike) gegevens en fertroulike (finansjele) gegevens yn dokuminten foardat se publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer.

    Lêst feroare op 5 septimber 2024 om 14:30 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA
    Status
    Yn gebrûk
  • It algoritme herkent en anonymisearret (persoanlike) gegevens en fertroulike (finansjele) gegevens yn dokuminten foardat se publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer.

    Lêst feroare op 21 maart 2024 om 9:54 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • It algoritme herkent en anonymisearret (persoanlike) gegevens en fertroulike (finansjele) gegevens yn dokuminten foardat se publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer.

    Lêst feroare op 4 april 2024 om 9:27 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk