Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.

Anonymisearje

It algoritme markearret persoanlike gegevens yn dokuminten. In meiwurker kontrolearret alles mei de hân en jout dan de opdracht om de markearre ynformaasje ûnomkearber te ferwiderjen of ûnlêsber te meitsjen. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e WOO. Dit is leechrisiko, selslearende AI.

Lêst feroare op 17 juny 2025 om 9:12 | Publikaasjestandaard 1.0
Publicatiecategorie
Oare algoritmes
Impacttoetsen
DPIA
Status
Yn gebrûk

Algemene ynformaasje

Tema

Organisaasje en bedriuwsfiering

Begjindatum

2023-01

Kontaktgegevens

gemeente@nissewaard.nl

Ferantwurde gebrûk

Doel en impact

De anonymisaasjesoftware wurdt brûkt om dokuminten dy't troch de gemeente publisearre binne rapper en better te anonymisearjen. Op dizze wize foldogge wy oan wet- en regeljouwing, wurde datalekken foarkommen en drage wy by oan in bettere beskerming fan 'e AVG-rjochten fan betrokkenen.

Afwagings

De gemeente moat ynformaasje hieltyd faker iepenbier meitsje. Dêrom moat privacy- of bedriuwsgefoelige ynformaasje swart makke wurde. It foardiel fan 'e anonymisaasjesoftware is dat anonymisaasje rapper en better is. In punt fan oandacht is dat de tekstlaach fan it dokumint analysearre wurdt troch in Microsoft Azure-tsjinner. De ynhâld wurdt net opslein op dizze tsjinner, wat betsjut dat it privacyrisiko fan it brûken fan it algoritme net opweegt tsjin it privacyfoardiel fan 'e fermindering fan it oantal datalekken troch ferkearde anonymisaasje.

Minskele tuskenkomst

De meiwurker is ferplichte om alle siden yn it proses te kontrolearjen en beslút oft in dokumint korrekt anonymisearre is. De anonymisaasje wurdt allinich útfierd as de meiwurker dêr de opdracht ta jout.

Risikobehear

Der is gjin risiko fan automatisearre beslútfoarming en it algoritme hat gjin ynfloed op fûnemintele rjochten, om't it algoritme gjin besluten nimt mei juridyske gefolgen. It docht allinich in foarstel foar it anonymisearjen fan persoanlike gegevens. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, wat betsjut dat flaters fluch fûn wurde. Derneist wurdt it algoritme periodyk traind. Op fersyk fan ús organisaasje wurde ús dokuminten net brûkt om it algoritme te trainen. As it algoritme net goed genôch wurket, kinne wy ​​oanpassingen meitsje mei swarte en wite listen. De gemeentlike meiwurker docht altyd de lêste kontrôle oft in dokumint korrekt anonymisearre is. Der is in risiko dat meiwurkers net goed kontrolearje. Wy ferminderje dit troch omtinken te jaan oan it belang fan it sekuer kontrolearjen fan de persoanlike gegevens dy't troch it algoritme fûn wurde. It lêste risiko dat oerbliuwt is it privacyrisiko fan it brûken fan Azure. Omdat Microsoft ferplichte wurde kin om gegevens dy't it ferwurket oer te dragen oan de Amerikaanske autoriteiten fanwegen de Patriot Act. Om dizze risiko's te beheinen, hat de leveransier standert privacy tapast. Tekst dy't troch de API yn syngroane of asynchrone oprop nei de Azure-tsjinst ferstjoerd wurdt, kin tydlik troch Azure opslein wurde foar debuggen. Dizze opsje is lykwols útskeakele troch de leveransier. Dit beheint it risiko. Direkt nei ferwurking troch Azure wurde de gegevens en de gegevensferwurking wiske. Fierder is de leveransier ISO 27001-sertifisearre. De risiko's weagje net op tsjin de privacyfoardielen en it risiko fan hânmjittige anonymisaasje troch it net brûken fan dizze software.

Wettlike basis

1. WOO 2. WDO 3. UAVG 4. WEP 5. WDO

Links nei wettlike basis

  • Woo: https://wetten.overheid.nl/BWBR0045754/
  • WDO: https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:31995L0046
  • UAVG: https://wetten.overheid.nl/BWBR0040940
  • Wep: https://wetten.overheid.nl/BWBR0043961
  • Wdo: https://wetten.overheid.nl/BWBR0048156

Impacttoetsen

DPIA anonimiseringssoftware

Wurking

Gegevens

Alle ynformaasje dy't fûn wurdt yn 'e opladen dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. Dit kin gewoane persoanlike gegevens, spesjale persoanlike gegevens en kriminele gegevens omfetsje. It kin ek bedriuwsgefoelige ynformaasje omfetsje.

Technyske wurking

Dokuminten wurde troch in meiwurker nei de applikaasje upload. Op dat stuit wurdt in kopy makke fan it orizjineel yn 'e foarm fan in PDF mei in tekstlaach en de metadata fan it orizjinele dokumint wurdt fan 'e kopy helle. Dizze kopy komt úteinlik op in Nederlânske server telâne en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt troch in API oan it masinelearalgoritme oanbean. Dit is in Natural Language Processing-algoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje yn 'e analysearre teksten werom dêr't persoanlike gegevens wierskynlik foarkomme, tegearre mei de kânsskoare (in persintaazje). Op dat stuit wurdt de tekstlaach fuortendaliks út Azure helle. De kânsskoare wurdt brûkt tegearre mei eigen AI-modellen ûntwikkele troch de leveransier om persoanlike gegevens sa krekt mooglik te werkennen. De modellen wurde traind mei ûnder oare de folgjende traine datasets: CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall en UD Dutch Alpino v2.8. Minimale kaaiwurden foar de krektens fan it bepalen fan 'e persoanlike gegevens binne as folget: Benoemde entiteiten (presyzje): 0.78, Benoemde entiteiten (weromhelje): 0.76, Benoemde entiteiten (F-skoare): 0.77. Uteinlik kontrolearret in meiwurker it dokumint en as it dokumint finalisearre is, wurde de gegevens dy't anonymisearre wurde moatte permanint út 'e tekstlaach fuorthelle en wurdt in swarte balke pleatst.

Leveransier

Xxllnc

Soartgelikense algoritme beskriuwingen

  • It algoritme identifisearret persoanlike gegevens en foarôf ynfierde wurden yn dokuminten. In meiwurker moat troch it dokumint gean en kontrolearje oft de warskôging korrekt is en it goedkarre of ôfwize. In meiwurker kin sels merken tafoegje. Nei goedkarring troch de meiwurker, alle goedkard sinjalen en markearrings skildere swart.

    Lêst feroare op 14 oktober 2024 om 10:02 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 10 febrewaris 2025 om 11:32 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    Yn gebrûk
  • It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje dat it dokumint goed lakt is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 5 febrewaris 2025 om 9:15 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    Yn gebrûk
  • It algoritme ûnderstreeket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).

    Lêst feroare op 11 juny 2025 om 12:27 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • It algoritme ûnderstreeket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).

    Lêst feroare op 5 juny 2025 om 9:29 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA
    Status
    Yn gebrûk