Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.
Anonymisearje
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
Algemene ynformaasje
Tema
Begjindatum
Einddatum
Kontaktgegevens
Link nei publykspagina
Ferantwurde gebrûk
Doel en impact
De anonymisaasjesoftware wurdt brûkt om dokuminten dy't troch de gemeente publisearre binne rapper en better te anonymisearjen. Op dizze wize foarkomme wy datalekken en drage wy by oan in bettere beskerming fan 'e GDPR-rjochten fan betrokkenen.
Afwagings
De gemeente wurdt hieltyd mear ferplichte om ynformaasje iepenbier te meitsjen. Dêrom moat privacy- of bedriuwsgefoelige ynformaasje swart makke wurde. Foardat it algoritme ynset waard, gie dit skilderjen net altyd goed. Datalekken kamen foar wêr't net alle persoanlike gegevens swart wiene of wêr't swart makke ynformaasje noch lêsber wie. It foardiel fan 'e anonymisaasjesoftware is dat anonymisaasje rapper en better is. It neidiel is dat de tekstlaach fan it dokumint analysearre wurdt troch in Microsoft Azure-tsjinner. De ynhâld wurdt net opslein op dizze server, dus it privacyrisiko fan it brûken fan it algoritme weaget net op tsjin it privacyfoardiel fan it ferminderjen fan it oantal datalekken fanwegen ferkearde anonymisaasje.
Minskele tuskenkomst
De útkomst fan it algoritme wurdt kontrolearre troch in meiwurker. De software fereasket dat de meiwurker alle siden kontrolearret. De meiwurker bepaalt oft it dokumint korrekt anonymisearre is.
Risikobehear
Der is gjin risiko fan automatisearre beslútfoarming en it algoritme hat gjin ynfloed op fûnemintele rjochten, om't it algoritme gjin besluten nimt mei juridyske gefolgen. It docht allinich in foarstel foar it anonymisearjen fan persoanlike gegevens. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, wêrtroch flaters fluch fûn wurde kinne. Derneist wurdt it algoritme periodyk traind. Op fersyk fan ús organisaasje wurde ús dokuminten net brûkt om it algoritme te trainen. As it algoritme net goed genôch wurket, kinne wy oanpassingen meitsje mei swarte en wite listen. De meiwurker fan 'e gemeente docht altyd de lêste kontrôle om te sjen oft in dokumint korrekt anonymisearre is. Der is in risiko dat meiwurkers net goed kontrolearje, wy ferminderje dit troch omtinken te jaan oan it belang fan it soarchfâldich kontrolearjen fan de persoanlike gegevens dy't troch it algoritme fûn wurde. It lêste risiko dat oerbliuwt is it privacyrisiko fan it brûken fan Azure. Omdat Microsoft miskien ferplichte wurdt om gegevens dy't it ferwurket oer te jaan oan Amerikaanske autoriteiten ûnder de Patriot Act. Om dizze risiko's te beheinen, hat de leveransier standert privacy tapast. Tekst dy't troch de API ferstjoerd wurdt yn syngroane of asynchrone oprop nei de Azure-tsjinst kin tydlik troch Azure opslein wurde foar debuggen. Mar dizze opsje is útskeakele troch de leveransier. Dat beheint it risiko. Direkt nei ferwurking troch Azure wurde de gegevens en gegevensferwurking wiske. Fierder is de leveransier ISO 27001-sertifisearre. De risiko's weagje net op tsjin de foardielen foar privacy en it risiko fan minne anonymisaasje troch it net brûken fan dizze software.
Wettlike basis
1. WOO 2. WDO 3. UAVG 4. WEP 5. WDO
Links nei wettlike basis
- Woo: https://wetten.overheid.nl/BWBR0045754/
- WDO: https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:31995L0046
- UAVG: https://wetten.overheid.nl/BWBR0040940
- Wep: https://wetten.overheid.nl/BWBR0043961
- Wdo: https://wetten.overheid.nl/BWBR0048156
Link nei ferwurkingsregister
Impacttoetsen
- DEDA anonimiseringssoftware
- DPIA anonimiseringssoftware
Wurking
Gegevens
Alle ynformaasje dy't fûn wurdt yn 'e opladen dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. Dit kin gean om gewoane persoansgegevens, spesjale persoansgegevens en strafrjochtlike gegevens. It kin ek kommersjeel gefoelige ynformaasje omfetsje.
Technyske wurking
Dokuminten wurde troch in meiwurker nei de applikaasje uploaden. Op dit punt wurdt in kopy fan it orizjineel makke yn 'e foarm fan in PDF mei in tekstlaach en wurde de metadata fan it orizjinele dokumint út 'e kopy fuorthelle. Dizze kopy wurdt opslein op in Nederlânske server en sil dêr maksimaal 30 dagen bliuwe. De tekstlaach fan 'e PDF wurdt oan it masinelearenalgoritme levere fia in API. It giet om in algoritme foar Natuerlike Taalferwurking (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje yn 'e analysearre teksten werom wêr't in persoanlik gegevensitem wierskynlik foarkomt, tegearre mei de kânsskoare (in persintaazje). Op dat stuit sil de tekstlaach direkt út Azure fuorthelle wurde. De kânsskoare wurdt brûkt tegearre mei eigen AI-modellen dy't ûntwikkele binne troch de leveransier om te soargjen dat persoanlike gegevens sa akkuraat mooglik werkenber binne. De modellen wurde traind mei de folgjende traine datasets: CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations foar UD LassySmall en UD Dutch Alpino v2.8. Minimale kaaiwurden foar de krektens fan it bepalen fan persoanlike gegevens binne as folget: Benoemde entiteiten (presyzje): 0.78, Benoemde entiteiten (weromroppen): 0.76, Benoemde entiteiten (F-skoare): 0.77. Uteinlik kontrolearret in meiwurker it dokumint en as it dokumint finalisearre is, wurde de gegevens dy't anonymisearre wurde moatte permanint út 'e tekstlaach fuorthelle en wurdt in swarte balke pleatst.
Leveransier
Soartgelikense algoritme beskriuwingen
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en makket it swart. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 20 maaie 2025 om 10:07 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en makket it swart. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 29 april 2025 om 13:39 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en makket it swart. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 6 maaie 2025 om 12:12 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk
- It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 12 novimber 2024 om 7:25 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 20 novimber 2024 om 10:04 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk