Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.

Anonymisearje

It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

Lêst feroare op 10 febrewaris 2025 om 15:13 | Publikaasjestandaard 1.0
Publicatiecategorie
Oare algoritmes
Impacttoetsen
DPIA, ...
Status
Yn gebrûk

Algemene ynformaasje

Tema

Fjild net ynfierd.

Begjindatum

2023-02

Kontaktgegevens

info@hltsamen.nl

Ferantwurde gebrûk

Doel en impact

De anonimisearringssoftware wurdt brûkt om dokuminten dy't troch de gemeente publisearre binne flugger en better te anonymisearjen. Op dizze manier foarkomme wy gegevenslekken en drage wy by oan bettere beskerming fan de GDPR-rjochten fan gegevenssubjekten.

Afwagings

De gemeente wurdt hieltyd mear ferplichte om ynformaasje iepenbier te meitsjen. Dêrom moat privacy of saaklike gefoelige ynformaasje swart wurde. Foardat it algoritme ynset waard, gie dit skilderij net altyd goed. Gegevenslekken fûnen plak wêr't net alle persoanlike gegevens swart wiene of wêr't swarte ynformaasje noch lêsber wie. It foardiel fan de anonymisaasjesoftware is dat anonymisaasje flugger en better is. It neidiel is dat de tekstlaach fan it dokumint wurdt analysearre troch in Microsoft Azure-tsjinner. De ynhâld wurdt net opslein op dizze tsjinner, sadat it privacyrisiko fan it brûken fan it algoritme net opwicht tsjin it privacyfoardiel fan it ferminderjen fan it oantal gegevenslekken troch ferkearde anonymisaasje.

Minskele tuskenkomst

De útkomst fan it algoritme wurdt kontrolearre troch in meiwurker. De software fereasket dat de meiwurker alle siden kontrolearret. De meiwurker bepaalt oft it dokumint korrekt anonymisearre is.

Risikobehear

Der is gjin risiko fan automatisearre beslútfoarming en it algoritme hat gjin ynfloed op fûnemintele rjochten, om't it algoritme gjin besluten makket mei juridyske gefolgen. It makket allinich in foarstel foar anonymisearjen fan persoanlike gegevens. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, wêrtroch flaters fluch fûn wurde kinne. Derneist wurdt it algoritme periodyk traind. Op fersyk fan ús organisaasje wurde ús dokuminten net brûkt om it algoritme te trenen. As it algoritme net goed genôch wurket, kinne wy ​​​​oanpassingen meitsje mei swarte en wite listen. De gemeentemeiwurker fiert altyd de lêste kontrôle út oft in dokumint goed anonymisearre is. Der is in risiko dat meiwurkers net goed kontrolearje, wy mitigearje dit troch omtinken te jaan oan it belang fan soarchfâldich kontrolearjen fan de persoanlike gegevens fûn troch it algoritme. It lêste risiko dat bliuwt is it privacyrisiko fan it brûken fan Azure. Om't Microsoft miskien ferplicht wurde gegevens oer te jaan dy't it ferwurket oan Amerikaanske autoriteiten ûnder de Patriot Act. Om dizze risiko's te beheinen, hat de leveransier standert privacy tapast. Tekst stjoerd troch de API yn syngroane of asynchrone oproppen nei de Azure-tsjinst kin tydlik opslein wurde troch Azure foar debuggen. Mar dizze opsje is útskeakele troch de leveransier. Dat beheint it risiko. Fuort nei ferwurking troch Azure wurde de gegevens en gegevensferwurking wiske. Fierder is de leveransier ISO 27001 sertifisearre. De risiko's wegen net op tsjin de privacyfoardielen en it risiko fan minne anonymisaasje troch dizze software net te brûken.

Wettlike basis

1. WOO 2. WDO 3. UAVG 4. WEP 5. WDO

Links nei wettlike basis

  • Woo: https://wetten.overheid.nl/BWBR0045754/
  • WDO: https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:31995L0046
  • UAVG: https://wetten.overheid.nl/BWBR0040940
  • Wep: https://wetten.overheid.nl/BWBR0043961
  • Wdo: https://wetten.overheid.nl/BWBR0048156

Impacttoetsen

  • DEDA anonimiseringssoftware
  • DPIA anonimiseringssoftware

Wurking

Gegevens

Alle ynformaasje fûn yn 'e uploaded dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. It kin gean om gewoane persoanlike gegevens, spesjale persoanlike gegevens en kriminele gegevens. It kin ek omgean mei kommersjeel gefoelige ynformaasje.

Technyske wurking

Dokuminten wurde opladen nei de applikaasje troch in meiwurker. Op dit punt wurdt in kopy fan it orizjineel makke yn 'e foarm fan in PDF mei in tekstlaach en de metadata fan it orizjinele dokumint wurde fuortsmiten fan' e kopy. Dit eksimplaar wurdt opslein op in Nederlânske server en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt levere oan it masine-learalgoritme fia in API. It giet om in Natural Language Processing-algoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje werom yn 'e analysearre teksten wêr't in item mei persoanlike gegevens wierskynlik foarkomt, tegearre mei de kânsskoare (in persintaazje). Op dat stuit sil de tekstlaach fuortdaliks fuortsmiten wurde fan Azure. De kânsskoare wurdt brûkt tegearre mei proprietêre AI-modellen ûntwikkele troch de leveransier om te soargjen dat persoanlike gegevens sa sekuer mooglik erkend wurde. De modellen wurde oplaat mei de folgjende trained datasets: CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall en UD Dutch Alpino v2.8. Minimum kaai sifers foar de krektens fan it fêststellen fan persoanlike gegevens binne as folget: Named entiteiten (precision): 0,78, Named entiteiten (recall): 0,76, Named entiteiten (F-score): 0,77. Uteinlik kontrolearret in meiwurker it dokumint en as it dokumint is finalisearre, wurde de te anonymisearjen gegevens permanint fuortsmiten fan 'e tekstlaach en wurdt in swarte balke pleatst.

Leveransier

Xxllnc

Soartgelikense algoritme beskriuwingen

  • It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 22 april 2025 om 11:33 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 19 maart 2025 om 10:12 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA
    Status
    Yn gebrûk
  • It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 12 febrewaris 2025 om 9:26 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    Yn gebrûk
  • It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 10 febrewaris 2025 om 15:23 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    Yn gebrûk
  • It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 31 maart 2025 om 14:04 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk