Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.
Anonymisearje
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DEDA, DPIA
- Status
- Bûten gebrûk
Algemene ynformaasje
Tema
Begjindatum
Einddatum
Kontaktgegevens
Link nei publykspagina
Ferantwurde gebrûk
Doel en impact
De anonymisaasjesoftware wurdt brûkt om dokuminten dy't troch de gemeente publisearre binne rapper en better te anonymisearjen. Op dizze manier foarkomme wy datalekken en drage wy by oan in bettere beskerming fan 'e AVG-rjochten fan betrokkenen.
Afwagings
De gemeente wurdt hieltyd mear ferplichte om ynformaasje iepenbier te meitsjen. Dêrom moat privacygefoelige of kommersjeel gefoelige ynformaasje redigearre wurde. Foardat it algoritme ynset waard, gie dizze redigearring net altyd goed. Datalekken kamen foar wêrby't net alle persoanlike gegevens redigearre waarden, of wêrby't redigearre ynformaasje noch lêsber wie. It foardiel fan 'e anonymisaasjesoftware is dat anonymisaasje rapper en better útfierd wurdt. It neidiel is dat de tekstlaach fan it dokumint analysearre wurdt troch in Microsoft Azure-tsjinner. De ynhâld wurdt net opslein op dizze tsjinner, wat betsjut dat it privacyrisiko fan it brûken fan it algoritme net opweegt tsjin it privacyfoardiel fan 'e fermindering fan it oantal datalekken feroarsake troch ferkearde anonymisaasje.
Minskele tuskenkomst
De útkomst fan it algoritme wurdt kontrolearre troch in meiwurker. De meiwurker krijt in melding fan 'e software as net alle siden kontrolearre binne. De meiwurker bepaalt oft it dokumint korrekt anonymisearre is.
Risikobehear
Der is gjin risiko fan automatisearre beslútfoarming, en it algoritme hat gjin ynfloed op fûnemintele rjochten, om't it gjin besluten nimt mei juridyske gefolgen. It stelt allinich de anonymisaasje fan persoanlike gegevens foar. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, wêrtroch't flaters fluch fûn wurde. Derneist wurdt it algoritme periodyk traind. As it algoritme net goed genôch funksjonearret, kinne wy oanpassingen meitsje mei swarte listen en wite listen. In meiwurker fan 'e gemeente docht altyd de lêste kontrôle om te ferifiearjen dat in dokumint korrekt anonymisearre is. Der is in risiko dat meiwurkers miskien net goed ferifiearje; wy beheine dit troch it belang te beklamjen fan it soarchfâldich ferifiearjen fan 'e persoanlike gegevens dy't troch it algoritme fûn binne. It lêste oerbleaune risiko is it privacyrisiko dat ferbûn is mei it gebrûk fan Azure. Microsoft kin ferplicht wurde om gegevens te leverjen oan Amerikaanske autoriteiten fanwegen de Patriot Act. Om dit risiko te ferminderjen, hat de leveransier standert privacybeskerming ymplementearre. Tekst dy't fia de API nei de Azure-tsjinst ferstjoerd wurdt, kin tydlik opslein wurde foar debuggen, mar dizze opsje is útskeakele. Dit ferminderet it risiko. De gegevens wurde direkt nei ferwurking troch Azure wiske. De leveransier hat ek in ISO 27001-sertifikaat. De foardielen foar privacy weagje swierder as de risiko's fan it net brûken fan dizze software.
Wettlike basis
1. WOO 2. WDO 3. UAVG 4. WEP 5. WDO
Links nei wettlike basis
- Woo: https://wetten.overheid.nl/BWBR0045754/
- WDO: https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:31995L0046
- UAVG: https://wetten.overheid.nl/BWBR0040940
- Wep: https://wetten.overheid.nl/BWBR0043961
- Wdo: https://wetten.overheid.nl/BWBR0048156
Link nei ferwurkingsregister
Impacttoetsen
- De Ethische Data Assistant (DEDA)
- Data Protection Impact Assessment (DPIA)
Wurking
Gegevens
Alle ynformaasje dy't fûn wurdt yn 'e opladen dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. Dit kin gewoane persoanlike gegevens, spesjale persoanlike gegevens en kriminele gegevens omfetsje. It kin ek kommersjeel gefoelige ynformaasje omfetsje.
Technyske wurking
Dokuminten wurde troch in meiwurker nei de applikaasje upload. Op dat stuit wurdt in kopy fan it orizjineel makke yn 'e foarm fan in PDF mei in tekstlaach, en de metadata fan it orizjinele dokumint wurdt fan 'e kopy helle. Dizze kopy komt úteinlik op in Nederlânske server telâne en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt fia in API oan it masinelearalgoritme levere. Dit giet om in Natuerlike Taalferwurkingsalgoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje yn 'e analysearre teksten werom dêr't persoanlike gegevens wierskynlik foarkomme, tegearre mei de kânsskoare (in persintaazje). Op dat stuit wurdt de tekstlaach fuortendaliks út Azure helle. De kânsskoare wurdt tegearre mei eigen AI-modellen ûntwikkele troch de leveransier brûkt om de herkenning fan persoanlike gegevens sa akkuraat mooglik út te fieren. De modellen wurde traind mei ûnder oare de folgjende traine datasets: CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall, en UD Dutch Alpino v2.8. Minimale kaaiwurden foar de krektens fan it fêststellen fan persoanlike gegevens binne as folget: Benoemde entiteiten (presyzje): 0.78, Benoemde entiteiten (weromhelje): 0.76, Benoemde entiteiten (F-skoare): 0.77. Uteinlik kontrolearret in meiwurker it dokumint, en nei foltôging wurde de gegevens dy't anonymisearre wurde moatte permanint út 'e tekstlaach fuorthelle en wurdt in swarte balke pleatst.
Leveransier
Soartgelikense algoritme beskriuwingen
- It algoritme ûnderstreeket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. Dêrnei ferwideret de software alle markearre ynformaasje en redigeret it. De dokuminten kinne dan publisearre wurde, bygelyks ûnder de Public Access to Government Information Act (WOO).Lêst feroare op 20 maaie 2026 om 11:18 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk
- It algoritme ûnderstreeket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. Dêrnei ferwideret de software alle markearre ynformaasje en redigeret it. De dokuminten kinne dan publisearre wurde, bygelyks ûnder de Public Access to Government Information Act (WOO).Lêst feroare op 17 maart 2026 om 8:47 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk
- It algoritme ûnderstreeket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en redigeret it. De dokuminten kinne dan publisearre wurde, bygelyks ûnder de Open Government Act (WOO).Lêst feroare op 28 augustus 2025 om 11:47 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk
- It algoritme ûnderstreeket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en redigeret it. De dokuminten kinne dan publisearre wurde, bygelyks ûnder de Open Government Act (WOO).Lêst feroare op 16 septimber 2025 om 12:34 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk
- It algoritme ûnderstreeket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en redigeret it. De dokuminten kinne dan publisearre wurde, bygelyks ûnder de Open Government Act (WOO).Lêst feroare op 19 desimber 2025 om 8:13 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk