Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.
Anonymisearje
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk
Algemene ynformaasje
Tema
Begjindatum
Kontaktgegevens
Ferantwurde gebrûk
Doel en impact
De anonymisaasjesoftware wurdt brûkt om dokuminten dy't troch de gemeente publisearre binne rapper en better te anonymisearjen. Op dizze wize foldogge wy oan wet- en regeljouwing, wurde datalekken foarkommen en drage wy by oan in bettere beskerming fan 'e AVG-rjochten fan betrokkenen.
Afwagings
De gemeente moat ynformaasje hieltyd faker iepenbier meitsje. Dêrom moat privacy- of bedriuwsgefoelige ynformaasje swart makke wurde. It foardiel fan 'e anonymisaasjesoftware is dat anonymisaasje rapper en better is. In punt fan oandacht is dat de tekstlaach fan it dokumint analysearre wurdt troch in Microsoft Azure-tsjinner. De ynhâld wurdt net opslein op dizze tsjinner, wat betsjut dat it privacyrisiko fan it brûken fan it algoritme net opweegt tsjin it privacyfoardiel fan 'e fermindering fan it oantal datalekken troch ferkearde anonymisaasje.
Minskele tuskenkomst
De meiwurker is ferplichte om alle siden yn it proses te kontrolearjen en beslút oft in dokumint korrekt anonymisearre is. De anonymisaasje wurdt allinich útfierd as de meiwurker dêr de opdracht ta jout.
Risikobehear
Der is gjin risiko fan automatisearre beslútfoarming en it algoritme hat gjin ynfloed op fûnemintele rjochten, om't it algoritme gjin besluten nimt mei juridyske gefolgen. It docht allinich in foarstel foar it anonymisearjen fan persoanlike gegevens. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, wat betsjut dat flaters fluch fûn wurde. Derneist wurdt it algoritme periodyk traind. Op fersyk fan ús organisaasje wurde ús dokuminten net brûkt om it algoritme te trainen. As it algoritme net goed genôch wurket, kinne wy oanpassingen meitsje mei swarte en wite listen. De gemeentlike meiwurker docht altyd de lêste kontrôle oft in dokumint korrekt anonymisearre is. Der is in risiko dat meiwurkers net goed kontrolearje. Wy ferminderje dit troch omtinken te jaan oan it belang fan it sekuer kontrolearjen fan de persoanlike gegevens dy't troch it algoritme fûn wurde. It lêste risiko dat oerbliuwt is it privacyrisiko fan it brûken fan Azure. Omdat Microsoft ferplichte wurde kin om gegevens dy't it ferwurket oer te dragen oan de Amerikaanske autoriteiten fanwegen de Patriot Act. Om dizze risiko's te beheinen, hat de leveransier standert privacy tapast. Tekst dy't troch de API yn syngroane of asynchrone oprop nei de Azure-tsjinst ferstjoerd wurdt, kin tydlik troch Azure opslein wurde foar debuggen. Dizze opsje is lykwols útskeakele troch de leveransier. Dit beheint it risiko. Direkt nei ferwurking troch Azure wurde de gegevens en de gegevensferwurking wiske. Fierder is de leveransier ISO 27001-sertifisearre. De risiko's weagje net op tsjin de privacyfoardielen en it risiko fan hânmjittige anonymisaasje troch it net brûken fan dizze software.
Wettlike basis
1. WOO 2. WDO 3. UAVG 4. WEP 5. WDO
Links nei wettlike basis
- Woo: https://wetten.overheid.nl/BWBR0045754/
- WDO: https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:31995L0046
- UAVG: https://wetten.overheid.nl/BWBR0040940
- Wep: https://wetten.overheid.nl/BWBR0043961
- Wdo: https://wetten.overheid.nl/BWBR0048156
Impacttoetsen
Wurking
Gegevens
Alle ynformaasje dy't fûn wurdt yn 'e opladen dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. Dit kin gewoane persoanlike gegevens, spesjale persoanlike gegevens en kriminele gegevens omfetsje. It kin ek bedriuwsgefoelige ynformaasje omfetsje.
Technyske wurking
Dokuminten wurde troch in meiwurker nei de applikaasje upload. Op dat stuit wurdt in kopy makke fan it orizjineel yn 'e foarm fan in PDF mei in tekstlaach en de metadata fan it orizjinele dokumint wurdt fan 'e kopy helle. Dizze kopy komt úteinlik op in Nederlânske server telâne en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt troch in API oan it masinelearalgoritme oanbean. Dit is in Natural Language Processing-algoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje yn 'e analysearre teksten werom dêr't persoanlike gegevens wierskynlik foarkomme, tegearre mei de kânsskoare (in persintaazje). Op dat stuit wurdt de tekstlaach fuortendaliks út Azure helle. De kânsskoare wurdt brûkt tegearre mei eigen AI-modellen ûntwikkele troch de leveransier om persoanlike gegevens sa krekt mooglik te werkennen. De modellen wurde traind mei ûnder oare de folgjende traine datasets: CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall en UD Dutch Alpino v2.8. Minimale kaaiwurden foar de krektens fan it bepalen fan 'e persoanlike gegevens binne as folget: Benoemde entiteiten (presyzje): 0.78, Benoemde entiteiten (weromhelje): 0.76, Benoemde entiteiten (F-skoare): 0.77. Uteinlik kontrolearret in meiwurker it dokumint en as it dokumint finalisearre is, wurde de gegevens dy't anonymisearre wurde moatte permanint út 'e tekstlaach fuorthelle en wurdt in swarte balke pleatst.
Leveransier
Soartgelikense algoritme beskriuwingen
- It algoritme identifisearret persoanlike gegevens en foarôf ynfierde wurden yn dokuminten. In meiwurker moat troch it dokumint gean en kontrolearje oft de warskôging korrekt is en it goedkarre of ôfwize. In meiwurker kin sels merken tafoegje. Nei goedkarring troch de meiwurker, alle goedkard sinjalen en markearrings skildere swart.Lêst feroare op 14 oktober 2024 om 10:02 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 10 febrewaris 2025 om 11:32 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje dat it dokumint goed lakt is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 5 febrewaris 2025 om 9:15 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreeket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 11 juny 2025 om 12:27 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk
- It algoritme ûnderstreeket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 5 juny 2025 om 9:29 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk