Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.
Anonymisearje
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk
Algemene ynformaasje
Tema
Begjindatum
Kontaktgegevens
Ferantwurde gebrûk
Doel en impact
De anonymisaasjesoftware wurdt brûkt om dokuminten dy't troch de gemeente publisearre binne rapper en better te anonymisearjen. Op dizze manier foarkomme wy datalekken en drage wy by oan in bettere beskerming fan 'e AVG-rjochten fan betrokkenen.
Afwagings
De gemeente moat hieltyd mear ynformaasje iepenbier meitsje. Dêrom moat privacy- of bedriuwsgefoelige ynformaasje swart makke wurde. Foardat it algoritme brûkt waard, gie dit swart meitsjen net altyd goed. Der wiene datalekken wêrby't net alle persoanlike gegevens swart makke wiene of wêrby't swart makke ynformaasje noch lêzen wurde koe. It foardiel fan 'e anonymisaasjesoftware is dat it rapper en better anonymisearret. It neidiel is dat de tekstlaach fan it dokumint analysearre wurdt troch in Microsoft Azure-tsjinner. De ynhâld wurdt net opslein op dizze tsjinner, wat betsjut dat it privacyrisiko fan it brûken fan it algoritme net opweegt tsjin it privacyfoardiel fan 'e fermindering fan it oantal datalekken troch ferkearde anonymisaasje.
Minskele tuskenkomst
De útkomst fan it algoritme wurdt kontrolearre troch in meiwurker. De meiwurker wurdt troch de software ferplichte om alle siden te kontrolearjen. De meiwurker bepaalt oft it dokumint korrekt anonymisearre is.
Risikobehear
Der is gjin risiko fan automatisearre beslútfoarming en it algoritme hat gjin ynfloed op fûnemintele rjochten, om't it algoritme gjin besluten nimt mei juridyske gefolgen. It docht allinich in foarstel foar it anonymisearjen fan persoanlike gegevens. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, wat betsjut dat flaters fluch fûn wurde. Derneist wurdt it algoritme periodyk traind. Op fersyk fan ús organisaasje wurde ús dokuminten net brûkt om it algoritme te trainen. As it algoritme net goed genôch wurket, kinne wy oanpassingen meitsje mei swarte en wite listen. De gemeentlike meiwurker docht altyd de lêste kontrôle oft in dokumint korrekt anonymisearre is. Der is in risiko dat meiwurkers net goed kontrolearje, wy ferminderje dit troch omtinken te jaan oan it belang fan it sekuer kontrolearjen fan de persoanlike gegevens dy't troch it algoritme fûn wurde. It lêste risiko dat oerbliuwt is it privacyrisiko fan it brûken fan Azure. Omdat Microsoft ferplichte wurde kin om gegevens dy't it ferwurket oer te dragen oan de Amerikaanske autoriteiten fanwegen de Patriot Act. Om dizze risiko's te beheinen, hat de leveransier standert privacy tapast. Tekst dy't troch de API yn syngroane of asynchrone oprop nei de Azure-tsjinst ferstjoerd wurdt, kin tydlik troch Azure opslein wurde foar debuggen. Dizze opsje is lykwols útskeakele troch de leveransier. Dit beheint it risiko. Direkt nei ferwurking troch Azure wurde de gegevens en de gegevensferwurking wiske. Fierder is de leveransier ISO 27001-sertifisearre. De risiko's weagje net op tsjin de privacyfoardielen en it risiko fan minne anonymisaasje troch it net brûken fan dizze software.
Wettlike basis
1. WOO 2. WDO 3. UAVG 4. WEP 5. WDO
Links nei wettlike basis
- Woo: https://wetten.overheid.nl/BWBR0045754/
- WDO: https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:31995L0046
- UAVG: https://wetten.overheid.nl/BWBR0040940
- Wep: https://wetten.overheid.nl/BWBR0043961
- Wdo: https://wetten.overheid.nl/BWBR0048156
Impacttoetsen
Wurking
Gegevens
Alle ynformaasje dy't fûn wurdt yn 'e opladen dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. Dit kin gewoane persoanlike gegevens, spesjale persoanlike gegevens en kriminele gegevens omfetsje. It kin ek bedriuwsgefoelige ynformaasje omfetsje.
Technyske wurking
Dokuminten wurde troch in meiwurker nei de applikaasje upload. Op dat stuit wurdt in kopy makke fan it orizjineel yn 'e foarm fan in PDF mei in tekstlaach en de metadata fan it orizjinele dokumint wurdt fan 'e kopy helle. Dizze kopy komt úteinlik op in Nederlânske server telâne en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt troch in API oan it masinelearalgoritme oanbean. Dit is in Natural Language Processing-algoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje yn 'e analysearre teksten werom dêr't persoanlike gegevens wierskynlik foarkomme, tegearre mei de kânsskoare (in persintaazje). Op dat stuit wurdt de tekstlaach fuortendaliks út Azure helle. De kânsskoare wurdt brûkt tegearre mei eigen AI-modellen ûntwikkele troch de leveransier om persoanlike gegevens sa krekt mooglik te werkennen. De modellen wurde traind mei ûnder oare de folgjende traine datasets: CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall en UD Dutch Alpino v2.8. Minimale kaaiwurden foar de krektens fan it bepalen fan 'e persoanlike gegevens binne as folget: Benoemde entiteiten (presyzje): 0.78, Benoemde entiteiten (weromhelje): 0.76, Benoemde entiteiten (F-skoare): 0.77. Uteinlik kontrolearret in meiwurker it dokumint en as it dokumint finalisearre is, wurde de gegevens dy't anonymisearre wurde moatte permanint út 'e tekstlaach fuorthelle en wurdt in swarte balke pleatst.
Leveransier
Soartgelikense algoritme beskriuwingen
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en makket it swart. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 29 april 2025 om 13:39 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en makket it swart. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 12 maaie 2025 om 10:44 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en makket it swart. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 20 maaie 2025 om 10:07 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 8 jannewaris 2025 om 13:06 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk
- It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 12 novimber 2024 om 7:25 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk