Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.

Anonymisearje

It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

Lêst feroare op 20 novimber 2024 om 10:04 | Publikaasjestandaard 1.0
Publicatiecategorie
Oare algoritmes
Impacttoetsen
Fjild net ynfierd.
Status
Yn gebrûk

Algemene ynformaasje

Tema

Fjild net ynfierd.

Begjindatum

08-2023

Kontaktgegevens

info@woudenberg.nl

Link nei publykspagina

www.woudenberg.nl

Ferantwurde gebrûk

Doel en impact

De anonimisearringssoftware wurdt brûkt om dokuminten dy't de gemeente publisearret flugger en better te anonymisearjen. Op dizze manier foarkomme wy gegevenslekken en drage wy by oan bettere beskerming fan de GDPR-rjochten fan gegevenssubjekten.

Afwagings

De gemeente moat hieltyd mear ynformaasje iepenbier meitsje. Dêrom moat privacy of saaklike gefoelige ynformaasje yn alle gefallen ferburgen wurde. Foardat it algoritme brûkt waard, gie dit skilderij net altyd goed. Der barde gegevenslekken wêryn't net alle persoanlike gegevens ferburgen wiene of wêryn ferburgen ynformaasje noch lêzen wurde koe. It foardiel fan de anonymisaasjesoftware is dat anonymisaasje flugger en better is. It neidiel is dat de tekstlaach fan it dokumint wurdt analysearre troch in Microsoft Azure-tsjinner. De ynhâld wurdt net opslein op dizze tsjinner, sadat it privacyrisiko fan it brûken fan it algoritme net opwicht tsjin it privacyfoardiel fan 'e ôfnimming fan it oantal gegevenslekken troch ferkearde anonymisaasje.

Minskele tuskenkomst

De útkomst fan it algoritme wurdt kontrolearre troch in meiwurker. Wat kontrolearret alle siden. De meiwurker bepaalt oft it dokumint korrekt anonymisearre is.

Risikobehear

Der is gjin risiko fan automatisearre beslútfoarming en it algoritme hat gjin ynfloed op fûnemintele rjochten, om't it algoritme gjin besluten makket mei juridyske gefolgen. It makket allinich in foarstel foar anonymisearjen fan persoanlike gegevens. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, sadat flaters gau fûn wurde. Derneist wurdt it algoritme periodyk traind. Op fersyk fan ús organisaasje wurde ús dokuminten net brûkt om it algoritme te trenen. As it algoritme net goed genôch wurket, kinne wy ​​oanpassingen meitsje mei swart-wite listen De gemeentemeiwurker fiert altyd de lêste kontrôle út oft in dokumint goed anonymisearre is. Der is in risiko dat meiwurkers net goed kontrolearje, wy mitigearje dit troch omtinken te jaan oan it belang fan soarchfâldich kontrolearjen fan 'e persoanlike gegevens fûn troch it algoritme. It lêste risiko dat bliuwt is it privacyrisiko fan it brûken fan Azure. Om't Microsoft miskien ferplicht wurde om gegevens oer te bringen dy't it ferwurket nei Amerikaanske autoriteiten fanwegen de Patriot Act. Om dizze risiko's te beheinen, hat de leveransier standert privacy tapast. Tekst stjoerd troch de API yn syngroane of asynchrone oproppen nei de Azure-tsjinst kin tydlik wurde opslein troch Azure foar debuggen. Mar de leveransier hat dizze opsje útskeakele. Dat beheint it risiko. Fuort nei ferwurking troch Azure wurde de gegevens en gegevensferwurking wiske. Fierder is de leveransier ISO 27001 sertifisearre. De risiko's wegen net op tsjin de privacyfoardielen en it risiko fan minne anonymisaasje troch dizze software net te brûken.

Wettlike basis

1. WOO 2. WDO 3. UAVG 4. WEP 5. WDO

Links nei wettlike basis

  • Woo: https://wetten.overheid.nl/BWBR0045754/
  • WDO: https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:31995L0046
  • UAVG: https://wetten.overheid.nl/BWBR0040940
  • Wep: https://wetten.overheid.nl/BWBR0043961
  • Wdo: https://wetten.overheid.nl/BWBR0048156

Wurking

Gegevens

Alle ynformaasje fûn yn 'e uploaded dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. It kin gean om gewoane persoanlike gegevens, bysûndere persoanlike gegevens en strafrjochtlike gegevens. It kin ek gean om saaklike gefoelige ynformaasje.

Technyske wurking

Dokuminten wurde opladen nei de applikaasje troch in meiwurker. Op dat stuit wurdt in kopy fan it orizjineel makke as in tekst-overlay PDF en wurde de metadata fan it orizjinele dokumint fan 'e kopy fuortsmiten. Dit eksimplaar komt telâne op in Nederlânske server en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt oanbean oan it masine-learalgoritme fia in API. It giet om in Natural Language Processing-algoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje yn 'e analysearre teksten werom wêr't persoanlike gegevens wierskynlik foarkomme, tegearre mei de kânsskoare (in persintaazje). Op dat stuit wurdt de tekstlaach fuortdaliks wiske fan Azure. De kânsskoare wurdt tegearre mei de eigen AI-modellen fan de leveransier brûkt om persoanlike gegevens sa sekuer mooglik te werkennen. De modellen wurde oplaat mei de folgjende trained datasets lykas CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall en UD Dutch Alpino v2.8. Minimum kaai sifers foar de krektens fan it fêststellen fan persoanlike gegevens binne as folget: Named entiteiten (precision): 0,78, Named entiteiten (recall): 0,76, Named entiteiten (F-score): 0,77. Uteinlik kontrolearret in meiwurker it dokumint en as hy of sy it dokumint foltôget, wurde de te anonymisearjen gegevens permanint fuortsmiten fan 'e tekstlaach en wurdt in swarte balke pleatst.

Leveransier

Xxllnc

Soartgelikense algoritme beskriuwingen

  • It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 31 oktober 2024 om 15:08 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    Yn ûntwikkeling
  • It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 12 novimber 2024 om 7:25 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    Yn gebrûk
  • It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 8 jannewaris 2025 om 13:06 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA
    Status
    Yn gebrûk
  • It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 31 oktober 2024 om 9:40 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    Yn gebrûk
  • It algoritme ûnderstreket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. Dan ferwideret de software alle markearre ynformaasje en ferve it swart. De dokuminten kinne dan publisearre wurde, bygelyks op grûn fan de Wet Iepen Bestjoer (WOO).

    Lêst feroare op 27 jannewaris 2025 om 10:18 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    Yn gebrûk