Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.

Anonymisaasje software DataMask

It algoritme anonymisearret dokuminten troch persoanlike gegevens te markearjen. In meiwurker kontrolearret oft de anonymisaasje goed útfierd is. Nei de goedkarring fan de meiwurker ferwideret de software de markearre gegevens en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks yn it ramt fan de WOO.

Lêst feroare op 24 septimber 2024 om 12:38 | Publikaasjestandaard 1.0
Publicatiecategorie
Ympaktfolle algoritmes
Impacttoetsen
DPIA, ...
Status
Yn gebrûk

Algemene ynformaasje

Tema

Organisaasje en bedriuwsfiering

Begjindatum

2024-05

Kontaktgegevens

provincieloket@gelderland.nl 026-359 9999

Ferantwurde gebrûk

Doel en impact

De anonimisearringssoftware wurdt brûkt om dokuminten dy't de provinsje publisearret flugger en better te anonymisearjen. Op dizze manier foarkomme wy gegevenslekken en drage wy by oan bettere beskerming fan de GDPR-rjochten fan gegevenssubjekten.

Afwagings

De provinsje Gelderlân moat hieltyd faker ynformaasje iepenbier meitsje. Om te foldwaan oan ûnder oare privacywetjouwing by publikaasje, moat privacy of bedriuwsgefoelige ynformaasje ferburgen wurde. Foardat it algoritme brûkt waard, gie dit skilderij net altyd goed. Der barde gegevenslekken wêryn't net alle persoanlike gegevens ferburgen wiene of wêryn ferburgen ynformaasje noch lêzen wurde koe. It foardiel fan de anonymisaasjesoftware is dat anonymisaasje flugger en better is. It neidiel is dat de tekstlaach fan it dokumint wurdt analysearre troch in Microsoft Azure-tsjinner. De ynhâld wurdt net opslein op dizze tsjinner, sadat it privacyrisiko fan it brûken fan it algoritme net opwicht tsjin it privacyfoardiel fan 'e ôfnimming fan it oantal gegevenslekken troch ferkearde anonymisaasje.

Minskele tuskenkomst

De útkomst fan it algoritme wurdt kontrolearre troch in meiwurker. De meiwurker wurdt troch de software ferplichte om alle siden te kontrolearjen. De meiwurker bepaalt oft it dokumint korrekt anonymisearre is.

Risikobehear

Der is gjin risiko fan automatisearre beslútfoarming of ynbreuk op fûnemintele rjochten, om't it algoritme gjin binende besluten makket, mar allinich útstellen docht foar anonymisearjen fan persoanlike gegevens. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, wat helpt om flaters fluch te identifisearjen. Fierder wurdt it algoritme regelmjittich opnij traind om prestaasjes te ferbetterjen. Us organisaasje hat spesifyk frege dat ús dokuminten net wurde brûkt om it algoritme te trenen. As it algoritme net genôch genôch is, kinne wy ​​it proses ferfine troch saneamde blacklists en whitelists te brûken. In swarte list befettet termen of gegevens, lykas spesifike nammen of adressen, dy't altyd markearre en anonymisearre wurde moatte. Op de whitelist stiet der oan de oare kant ynformaasje dy't net markearre hoecht te wurden, bygelyks omdat it gjin persoanlike gegevens giet of omdat it om ynformaasje giet dy't eksplisyt net anonymisearre wurde mei, lykas baantitels of algemiene betingsten. Dit makket it mooglik om de krektens fan anonymisaasje fierder te ferbetterjen.


De lêste stap yn it proses is altyd in manuele kontrôle troch in provinsjale meiwurker, dy't beoardielet oft de anonimisaasje goed útfierd is. Der is lykwols in risiko dat meiwurkers net goed kontrolearje. Wy besykje dit te beheinen troch meiwurkers te herinnerjen oan it belang fan in yngeande kontrôle en soarchfâldige beoardieling fan de gegevens fûn troch it algoritme.


It oerbleaune risiko is it privacyrisiko by it brûken fan Azure. Troch de Patriot Act kin Microsoft yn guon gefallen ferplicht wurde gegevens oer te dragen oan Amerikaanske autoriteiten. Om dit risiko te ferminderjen jildt de leveransier standert privacy. Dit betsjut dat de standertynstellingen altyd privacyfreonlik binne. As gegevens wurde stjoerd nei de Azure-tsjinst fia de API, kin it syngroan of asynchronysk dien wurde. De ferkeaper hat der foar keazen om de funksje út te skeakeljen wêr't Azure de gegevens tydlik opslacht fia de API foar debuggen. Dit betsjut dat de gegevens fuortendaliks nei ferwurking wiske wurde. Derneist is de leveransier ISO 27001 sertifisearre, wat befêstiget dat gegevensbeskerming goed regele is. It brûken fan dizze software, mei de neamde foarsoarchsmaatregels, biedt mear foardielen dan de risiko's fan net goed anonymisearjen fan gegevens sûnder dit ark.

Wettlike basis

1. WOO 2. WDO 3. UAVG 4. WEP 5. WDO

Links nei wettlike basis

  • Woo: https://wetten.overheid.nl/BWBR0045754/
  • WDO: https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:31995L0046
  • UAVG: https://wetten.overheid.nl/BWBR0040940
  • Wep: https://wetten.overheid.nl/BWBR0043961
  • Wdo: https://wetten.overheid.nl/BWBR0048156
  • Wet elektronische publicaties: https://wetten.overheid.nl/BWBR0043961/2024-01-01

Link nei ferwurkingsregister

Trustbound

Taljochting op impacttoetsen

DEDA & DPIA útfierd troch DataMask. Pre-DPIA útfierd troch de provinsje Gelderlân. ICO Wizard oanfrege troch de provinsje Gelderlân, foltôge troch DataMask.

Impacttoetsen

  • DEDA anonimiseringssoftware
  • DPIA anonimiseringssoftware
  • ICO Wizard (BIO)

Wurking

Gegevens

Alle ynformaasje fûn yn 'e uploaded dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. It kin gean om gewoane persoanlike gegevens, bysûndere persoanlike gegevens en strafrjochtlike gegevens. It kin ek gean om saaklike gefoelige ynformaasje.

Technyske wurking

Dokuminten wurde opladen nei de applikaasje troch in meiwurker. Op dat stuit wurdt fan it orizjineel in (tydlike) kopy makke yn de foarm fan in PDF mei in tekstlaach en wurde de metadata fan it orizjinele dokumint út de kopy helle. Dit eksimplaar komt telâne op in Nederlânske server en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt oanbean oan it masine-learalgoritme fia in API. It giet om in Natural Language Processing-algoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje yn 'e analysearre teksten werom wêr't persoanlike gegevens wierskynlik foarkomme, tegearre mei de kânsskoare (in persintaazje). Op dat stuit wurdt de tekstlaach fuortdaliks wiske fan Azure. De kânsskoare wurdt tegearre mei de eigen AI-modellen fan de leveransier brûkt om persoanlike gegevens sa sekuer mooglik te werkennen. De modellen wurde oplaat mei de folgjende trained datasets lykas CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall en UD Dutch Alpino v2.8. Minimum kaai sifers foar de krektens fan it fêststellen fan persoanlike gegevens binne as folget: Named entiteiten (precision): 0,78, Named entiteiten (recall): 0,76, Named entiteiten (F-score): 0,77. Uteinlik kontrolearret in meiwurker it dokumint en as hy of sy it dokumint foltôget, wurde de te anonymisearjen gegevens permanint fuortsmiten fan 'e tekstlaach en swart skildere.

Leveransier

DataMask BV

Soartgelikense algoritme beskriuwingen

  • It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 31 oktober 2024 om 9:40 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    Yn gebrûk
  • It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 12 novimber 2024 om 7:25 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    Yn gebrûk
  • It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 8 jannewaris 2025 om 13:06 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA
    Status
    Yn gebrûk
  • It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 20 novimber 2024 om 10:04 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 31 oktober 2024 om 15:08 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    Yn ûntwikkeling