Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.
Anonymisearje
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk
Algemene ynformaasje
Tema
- Organisaasje en bedriuwsfiering
- Natuer en miljeu
Begjindatum
Kontaktgegevens
Link nei publykspagina
Ferantwurde gebrûk
Doel en impact
De anonimisearringssoftware wurdt brûkt om dokuminten dy't de Miljeutsjinst Drintse publisearre binne flugger en uniformer te anonymisearjen. Op dizze manier foarkomme wy gegevenslekken en drage wy by oan bettere beskerming fan de GDPR-rjochten fan gegevenssubjekten.
Afwagings
De Miljeutsjinst Drint wurdt hieltyd mear ferplichte om ynformaasje iepenbier te meitsjen. Dêrom moat privacy of saaklike gefoelige ynformaasje swart wurde. Foardat it algoritme ynset waard, gie dit skilderij net altyd goed. Gegevenslekken fûnen plak wêr't net alle persoanlike gegevens swart wiene of wêr't swarte ynformaasje noch lêsber wie. It foardiel fan de anonymisaasjesoftware is dat anonymisaasje flugger en unifoarm is. It neidiel is dat de tekstlaach fan it dokumint wurdt analysearre troch in Microsoft Azure-tsjinner. De ynhâld wurdt net opslein op dizze tsjinner, sadat it privacyrisiko fan it brûken fan it algoritme net opwicht tsjin it privacyfoardiel fan it ferminderjen fan it oantal gegevenslekken troch ferkearde anonymisaasje.
Minskele tuskenkomst
De útkomst fan it algoritme wurdt kontrolearre troch in meiwurker. De software fereasket dat de meiwurker alle siden kontrolearret. De meiwurker bepaalt oft it dokumint korrekt anonymisearre is.
Risikobehear
Der is gjin risiko fan automatisearre beslútfoarming en it algoritme hat gjin ynfloed op fûnemintele rjochten, om't it algoritme gjin besluten makket mei juridyske gefolgen. It makket allinich in foarstel foar anonymisearjen fan persoanlike gegevens. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, wêrtroch flaters fluch fûn wurde kinne. Derneist wurdt it algoritme periodyk traind. As it algoritme net goed genôch wurket, kinne wy oanpassingen meitsje mei swarte en wite listen. De gemeentemeiwurker fiert altyd de lêste kontrôle út oft in dokumint goed anonymisearre is. Der is in risiko dat meiwurkers net goed kontrolearje, wy mitigearje dit troch omtinken te jaan oan it belang fan soarchfâldich kontrolearjen fan de persoanlike gegevens fûn troch it algoritme. It lêste risiko dat bliuwt is it privacyrisiko fan it brûken fan Azure. Om't Microsoft miskien ferplicht wurde gegevens oer te jaan dy't it ferwurket oan Amerikaanske autoriteiten ûnder de Patriot Act. Om dizze risiko's te beheinen, hat de leveransier standert privacy tapast. Tekst stjoerd troch de API yn syngroane of asynchrone oproppen nei de Azure-tsjinst kin tydlik opslein wurde troch Azure foar debuggen. Mar dizze opsje is útskeakele troch de leveransier. Dat beheint it risiko. Fuort nei ferwurking troch Azure wurde de gegevens en gegevensferwurking wiske. Fierder is de leveransier ISO 27001 sertifisearre. De risiko's wegen net op tsjin de privacyfoardielen en it risiko fan minne anonymisaasje troch dizze software net te brûken.
Wettlike basis
1. WOO 2. AWB 3. AVG 4. Wpg
Taljochting op impacttoetsen
Ynfloedbeoardielingen binne útfierd troch de leveransier.
Impacttoetsen
Wurking
Gegevens
Alle ynformaasje fûn yn 'e uploaded dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. It kin gean om gewoane persoanlike gegevens, spesjale persoanlike gegevens en kriminele gegevens. It kin ek omgean mei kommersjeel gefoelige ynformaasje en persoanlike belied views.
Technyske wurking
Dokuminten wurde opladen nei de applikaasje troch in meiwurker. Op dit punt wurdt in kopy fan it orizjineel makke yn 'e foarm fan in PDF mei in tekstlaach en de metadata fan it orizjinele dokumint wurde fuortsmiten fan' e kopy. Dit eksimplaar wurdt opslein op in Nederlânske server en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt levere oan it masine-learalgoritme fia in API. It giet om in Natural Language Processing-algoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje werom yn 'e analysearre teksten wêr't in item mei persoanlike gegevens wierskynlik foarkomt, tegearre mei de kânsskoare (in persintaazje). Op dat stuit sil de tekstlaach fuortdaliks fuortsmiten wurde fan Azure. De kânsskoare wurdt brûkt tegearre mei proprietêre AI-modellen ûntwikkele troch de leveransier om te soargjen dat persoanlike gegevens sa sekuer mooglik erkend wurde. De modellen wurde oplaat mei de folgjende trained datasets: CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall en UD Dutch Alpino v2.8. Minimum kaai sifers foar de krektens fan it fêststellen fan persoanlike gegevens binne as folget: Named entiteiten (precision): 0,78, Named entiteiten (recall): 0,76, Named entiteiten (F-score): 0,77. Uteinlik kontrolearret in meiwurker it dokumint en as it dokumint is finalisearre, wurde de te anonymisearjen gegevens permanint fuortsmiten fan 'e tekstlaach en wurdt in swarte balke pleatst.
Leveransier
Soartgelikense algoritme beskriuwingen
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 22 april 2025 om 11:33 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 19 maart 2025 om 10:12 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 12 febrewaris 2025 om 9:26 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 10 febrewaris 2025 om 15:23 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).Lêst feroare op 31 maart 2025 om 14:04 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk