Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.

Anonymisearje

It algoritme markearret persoanlike gegevens yn dokuminten. In meiwurker kontrolearret dan manuell alle siden om te ferifiearjen oft de anonymisaasje folslein en korrekt is. Nei dizze kontrôle ferwideret de software de markearre gegevens, wêrnei't se redigearre wurde. De dokuminten kinne dan publisearre wurde, bygelyks ûnder de Open Government Act (Woo).
Lêst feroare op 17 juny 2026 om 9:25 | Publikaasjestandaard 1.0
Publicatiecategorie
Oare algoritmes
Impacttoetsen
DPIA
Status
Yn gebrûk

Algemene ynformaasje

Tema

Organisaasje en bedriuwsfiering

Begjindatum

2024-12

Kontaktgegevens

info@harlingen.nl

Ferantwurde gebrûk

Doel en impact

De anonymisaasjesoftware wurdt brûkt om dokuminten dy't troch de gemeente publisearre binne rapper en better te anonymisearjen. Op dizze manier foarkomme wy datalekken en drage wy by oan in bettere beskerming fan 'e AVG-rjochten fan betrokkenen.

Afwagings

De gemeente wurdt hieltyd faker ferplichte om ynformaasje iepenbier te meitsjen, yn dat gefal moatte privacy- en bedriuwsgefoelige gegevens redigearre wurde. Foar de ynset fan it algoritme waard dizze anonymisaasje mei de hân útfierd, wat net altyd goed dien waard. Dit hat laat ta datalekken, bygelyks om't persoanlike gegevens ûnbedoeld sichtber bleaunen of redigearre ynformaasje noch lêsber wie.

It algoritme helpt by it anonymisearjen fan dokuminten, wêrtroch dit proses rapper en konsekwinter wurdt. By it brûken fan it algoritme wurdt de tekstlaach fan dokuminten analysearre fia in Microsoft Azure-tsjinner. De ynhâld fan 'e dokuminten wurdt net opslein yn dit proses. Dit bringt in beheind privacyrisiko mei. Oan 'e oare kant draacht it algoritme by oan in fermindering fan datalekken dy't ûntsteane út ferkearde anonymisaasje, wat resulteart yn in netto posityf effekt op 'e beskerming fan persoanlike gegevens.

Minskele tuskenkomst

De útkomst fan it algoritme wurdt kontrolearre troch in meiwurker. De software fereasket dat de meiwurker alle siden kontrolearret. De meiwurker bepaalt oft it dokumint korrekt anonymisearre is.

Risikobehear

Der is gjin risiko fan automatisearre beslútfoarming, en it algoritme hat gjin ynfloed op fûnemintele rjochten, om't it gjin besluten nimt mei juridyske gefolgen. It stelt allinich de anonymisaasje fan persoanlike gegevens foar. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, wêrtroch't flaters fluch fûn wurde. Derneist wurdt it algoritme periodyk traind. Op fersyk fan ús organisaasje wurde ús dokuminten net brûkt om it algoritme te trainen. As it algoritme net goed genôch funksjonearret, kinne wy ​​oanpassingen meitsje mei swarte listen en wite listen. In meiwurker fan 'e gemeente docht altyd de lêste kontrôle om te ferifiearjen dat in dokumint korrekt anonymisearre is. Der is in risiko dat meiwurkers miskien net goed ferifiearje; wy ferminderje dit troch it belang te beklamjen fan it soarchfâldich ferifiearjen fan 'e persoanlike gegevens dy't troch it algoritme fûn wurde. It lêste oerbleaune risiko is it privacyrisiko dat ferbûn is mei it brûken fan Azure. Dit komt om't Microsoft miskien ferplichte is om gegevens dy't it ferwurket oer te dragen oan Amerikaanske autoriteiten fanwegen de Patriot Act. Om dizze risiko's te beheinen, hat de leveransier standert privacy ymplementearre. Tekst dy't troch de API nei de Azure-tsjinst ferstjoerd wurdt yn syngroane of asynchrone oprop kin tydlik troch Azure opslein wurde foar debuggen. De leveransier hat dizze opsje lykwols útskeakele. Dat beheint it risiko. Direkt nei ferwurking troch Azure wurde de gegevens en de gegevensferwurking wiske. Fierder is de leveransier ISO 27001-sertifisearre. De risiko's weagje net op tsjin de privacyfoardielen en it risiko fan ûnfoldwaande anonymisaasje feroarsake troch it net brûken fan dizze software.

Wettlike basis

1. WOO 2. WDO 3. UAVG 4. WEP 5. WDO

Links nei wettlike basis

  • Woo: https://wetten.overheid.nl/BWBR0045754/
  • WDO: https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:31995L0046
  • UAVG: https://wetten.overheid.nl/BWBR0040940
  • Wep: https://wetten.overheid.nl/BWBR0043961
  • Wdo: https://wetten.overheid.nl/BWBR0048156

Impacttoetsen

Data Protection Impact Assessment (DPIA)

Wurking

Gegevens

Alle ynformaasje dy't fûn wurdt yn 'e opladen dokuminten (útsein de metadata) wurdt ferwurke troch it algoritme. Dit kin gewoane persoanlike gegevens, spesjale persoanlike gegevens en kriminele gegevens omfetsje. It kin ek kommersjeel gefoelige ynformaasje omfetsje.

Technyske wurking

Dokuminten wurde troch in meiwurker nei de applikaasje upload. Op dat stuit wurdt in kopy fan it orizjineel makke yn 'e foarm fan in PDF mei in tekstlaach, en de metadata fan it orizjinele dokumint wurdt fan 'e kopy helle. Dizze kopy komt úteinlik op in Nederlânske server telâne en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt fia in API oan it masinelearalgoritme levere. Dit giet om in Natuerlike Taalferwurkingsalgoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje yn 'e analysearre teksten werom dêr't persoanlike gegevens wierskynlik foarkomme, tegearre mei de kânsskoare (in persintaazje). Op dat stuit wurdt de tekstlaach fuortendaliks út Azure helle. De kânsskoare wurdt tegearre mei eigen AI-modellen ûntwikkele troch de leveransier brûkt om de herkenning fan persoanlike gegevens sa akkuraat mooglik út te fieren. De modellen wurde traind mei ûnder oare de folgjende traine datasets: CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall, en UD Dutch Alpino v2.8. Minimale kaaiwurden foar de krektens fan it fêststellen fan persoanlike gegevens binne as folget: Benoemde entiteiten (presyzje): 0.78, Benoemde entiteiten (weromhelje): 0.76, Benoemde entiteiten (F-skoare): 0.77. Uteinlik kontrolearret in meiwurker it dokumint, en nei foltôging wurde de gegevens dy't anonymisearre wurde moatte permanint út 'e tekstlaach fuorthelle en wurdt in swarte balke pleatst.

Leveransier

Xxllnc

Soartgelikense algoritme beskriuwingen

  • It algoritme ûnderstreeket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en redigeret it. De dokuminten kinne dan publisearre wurde, bygelyks ûnder de Open Government Act (WOO).
    Lêst feroare op 28 augustus 2025 om 11:47 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • It algoritme ûnderstreeket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en redigeret it. De dokuminten kinne dan publisearre wurde, bygelyks ûnder de Open Government Act (WOO).
    Lêst feroare op 19 desimber 2025 om 8:13 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA
    Status
    Yn gebrûk
  • It algoritme ûnderstreeket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en redigeret it. De dokuminten kinne dan publisearre wurde, bygelyks ûnder de Open Government Act (WOO).
    Lêst feroare op 16 septimber 2025 om 12:34 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • It algoritme ûnderstreeket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en redigeret it. De dokuminten kinne dan publisearre wurde, bygelyks ûnder de Open Government Act (WOO).
    Lêst feroare op 21 augustus 2025 om 11:27 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • It algoritme ûnderstreeket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en redigeret it. De dokuminten kinne dan publisearre wurde, bygelyks ûnder de Open Government Act (WOO).
    Lêst feroare op 9 septimber 2025 om 14:31 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk