Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.
Anonymisaasje software DataMask
- Publicatiecategorie
- Ympaktfolle algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
Algemene ynformaasje
Tema
Begjindatum
Kontaktgegevens
Ferantwurde gebrûk
Doel en impact
De anonimisearringssoftware wurdt brûkt om dokuminten dy't de provinsje publisearret flugger en better te anonymisearjen. Op dizze manier foarkomme wy gegevenslekken en drage wy by oan bettere beskerming fan de GDPR-rjochten fan gegevenssubjekten.
Afwagings
De provinsje Gelderlân moat hieltyd faker ynformaasje iepenbier meitsje. Om te foldwaan oan ûnder oare privacywetjouwing by publikaasje, moat privacy of bedriuwsgefoelige ynformaasje ferburgen wurde. Foardat it algoritme brûkt waard, gie dit skilderij net altyd goed. Der barde gegevenslekken wêryn't net alle persoanlike gegevens ferburgen wiene of wêryn ferburgen ynformaasje noch lêzen wurde koe. It foardiel fan de anonymisaasjesoftware is dat anonymisaasje flugger en better is. It neidiel is dat de tekstlaach fan it dokumint wurdt analysearre troch in Microsoft Azure-tsjinner. De ynhâld wurdt net opslein op dizze tsjinner, sadat it privacyrisiko fan it brûken fan it algoritme net opwicht tsjin it privacyfoardiel fan 'e ôfnimming fan it oantal gegevenslekken troch ferkearde anonymisaasje.
Minskele tuskenkomst
De útkomst fan it algoritme wurdt kontrolearre troch in meiwurker. De meiwurker wurdt troch de software ferplichte om alle siden te kontrolearjen. De meiwurker bepaalt oft it dokumint korrekt anonymisearre is.
Risikobehear
Der is gjin risiko fan automatisearre beslútfoarming of ynbreuk op fûnemintele rjochten, om't it algoritme gjin binende besluten makket, mar allinich útstellen docht foar anonymisearjen fan persoanlike gegevens. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, wat helpt om flaters fluch te identifisearjen. Fierder wurdt it algoritme regelmjittich opnij traind om prestaasjes te ferbetterjen. Us organisaasje hat spesifyk frege dat ús dokuminten net wurde brûkt om it algoritme te trenen. As it algoritme net genôch genôch is, kinne wy it proses ferfine troch saneamde blacklists en whitelists te brûken. In swarte list befettet termen of gegevens, lykas spesifike nammen of adressen, dy't altyd markearre en anonymisearre wurde moatte. Op de whitelist stiet der oan de oare kant ynformaasje dy't net markearre hoecht te wurden, bygelyks omdat it gjin persoanlike gegevens giet of omdat it om ynformaasje giet dy't eksplisyt net anonymisearre wurde mei, lykas baantitels of algemiene betingsten. Dit makket it mooglik om de krektens fan anonymisaasje fierder te ferbetterjen.
De lêste stap yn it proses is altyd in manuele kontrôle troch in provinsjale meiwurker, dy't beoardielet oft de anonimisaasje goed útfierd is. Der is lykwols in risiko dat meiwurkers net goed kontrolearje. Wy besykje dit te beheinen troch meiwurkers te herinnerjen oan it belang fan in yngeande kontrôle en soarchfâldige beoardieling fan de gegevens fûn troch it algoritme.
It oerbleaune risiko is it privacyrisiko by it brûken fan Azure. Troch de Patriot Act kin Microsoft yn guon gefallen ferplicht wurde gegevens oer te dragen oan Amerikaanske autoriteiten. Om dit risiko te ferminderjen jildt de leveransier standert privacy. Dit betsjut dat de standertynstellingen altyd privacyfreonlik binne. As gegevens wurde stjoerd nei de Azure-tsjinst fia de API, kin it syngroan of asynchronysk dien wurde. De ferkeaper hat der foar keazen om de funksje út te skeakeljen wêr't Azure de gegevens tydlik opslacht fia de API foar debuggen. Dit betsjut dat de gegevens fuortendaliks nei ferwurking wiske wurde. Derneist is de leveransier ISO 27001 sertifisearre, wat befêstiget dat gegevensbeskerming goed regele is. It brûken fan dizze software, mei de neamde foarsoarchsmaatregels, biedt mear foardielen dan de risiko's fan net goed anonymisearjen fan gegevens sûnder dit ark.
Wettlike basis
1. WOO 2. WDO 3. UAVG 4. WEP 5. WDO
Links nei wettlike basis
- Woo: https://wetten.overheid.nl/BWBR0045754/
- WDO: https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:31995L0046
- UAVG: https://wetten.overheid.nl/BWBR0040940
- Wep: https://wetten.overheid.nl/BWBR0043961
- Wdo: https://wetten.overheid.nl/BWBR0048156
- Wet elektronische publicaties: https://wetten.overheid.nl/BWBR0043961/2024-01-01
Link nei ferwurkingsregister
Taljochting op impacttoetsen
DEDA & DPIA útfierd troch DataMask. Pre-DPIA útfierd troch de provinsje Gelderlân. ICO Wizard oanfrege troch de provinsje Gelderlân, foltôge troch DataMask.
Impacttoetsen
- DEDA anonimiseringssoftware
- DPIA anonimiseringssoftware
- ICO Wizard (BIO)
Wurking
Gegevens
Alle ynformaasje fûn yn 'e uploaded dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. It kin gean om gewoane persoanlike gegevens, bysûndere persoanlike gegevens en strafrjochtlike gegevens. It kin ek gean om saaklike gefoelige ynformaasje.
Technyske wurking
Dokuminten wurde opladen nei de applikaasje troch in meiwurker. Op dat stuit wurdt fan it orizjineel in (tydlike) kopy makke yn de foarm fan in PDF mei in tekstlaach en wurde de metadata fan it orizjinele dokumint út de kopy helle. Dit eksimplaar komt telâne op in Nederlânske server en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt oanbean oan it masine-learalgoritme fia in API. It giet om in Natural Language Processing-algoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje yn 'e analysearre teksten werom wêr't persoanlike gegevens wierskynlik foarkomme, tegearre mei de kânsskoare (in persintaazje). Op dat stuit wurdt de tekstlaach fuortdaliks wiske fan Azure. De kânsskoare wurdt tegearre mei de eigen AI-modellen fan de leveransier brûkt om persoanlike gegevens sa sekuer mooglik te werkennen. De modellen wurde oplaat mei de folgjende trained datasets lykas CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall en UD Dutch Alpino v2.8. Minimum kaai sifers foar de krektens fan it fêststellen fan persoanlike gegevens binne as folget: Named entiteiten (precision): 0,78, Named entiteiten (recall): 0,76, Named entiteiten (F-score): 0,77. Uteinlik kontrolearret in meiwurker it dokumint en as hy of sy it dokumint foltôget, wurde de te anonymisearjen gegevens permanint fuortsmiten fan 'e tekstlaach en swart skildere.
Leveransier
Soartgelikense algoritme beskriuwingen
- It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 31 oktober 2024 om 9:40 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 12 novimber 2024 om 7:25 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 8 jannewaris 2025 om 13:06 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk
- It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 20 novimber 2024 om 10:04 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk
- It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 31 oktober 2024 om 15:08 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn ûntwikkeling