Terug naar alle algoritmes

Octobox Anonimiseren

Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.

Laatst gewijzigd op 26 november 2024 om 8:23 | Publicatiestandaard 1.0
Publicatiecategorie
Overige algoritmes
Impacttoetsen
Veld niet ingevuld.
Status
In gebruik

Algemene informatie

Thema

Organisatie en bedrijfsvoering

Begindatum

Veld niet ingevuld.

Contactgegevens

algoritmes@provincie-utrecht.nl

Verantwoord gebruik

Doel en impact

De anonimiseringstool wordt ingezet om invulling te geven aan enerzijds transparantie en anderzijds aan de noodzakelijke bescherming van de personen, bedrijven en instellingen op wie documenten betrekking hebben.


Transparantie omdat het de organisatie in staat stelt om informatie volgens regelgeving zoals de Woo te delen, actief danwel passief. Voor de burger over wie er gegevens in te publiceren documenten zijn opgenomen, betekent het gebruik dat er geen privacy schending plaatsvindt en de organisatie daarmee voldoet aan de AVG. Dat geldt ook voor de bescherming van privacygegevens van de medewerkers van de organisatie.


De aanvrager van een Woo verzoek krijgt de informatie waarom zij vroeg, hetzij in geanonimiseerde versie of deels gemaskeerd op basis van een andere grondslag. Voor de afdelingen binnen de organisatie die voor het afhandelen van een Woo verzoek en/of publicatie van informatie verantwoordelijk zijn, betekent het dat ze voldoen aan wet- en regelgeving. Gebruik van de software verkort de doorlooptijd en draagt derhalve bij aan het binnen de wettelijke termijnen kunnen aanbieden van gevraagde informatie.


De risico impact van het algoritme is laag. Dat geldt voor personen (burgers, medewerkers van afnemende organisaties) en bedrijven en instellingen. Het algoritme zoekt specifiek naar (persoons)gegevens en maskeert deze of duidt ze aan ongeacht de verdere inhoud van documenten. Er wordt een voorstel gedaan voor het anonimiseren van een tekstfragment aan een vakinhoudelijk persoon, er is geen sprake van automatische beslissingen. Daarnaast heeft de tool als optie om handmatig informatie te maskeren die om andere redenen niet publiek gemaakt kan worden. Daarmee kan bijvoorbeeld een tekstfragment met strategische informatie gemarkeerd worden, ter bescherming van de eigen organisatie of een partnerorganisatie (overheid, bedrijf of instelling). De grondslag van het anonimiseren of maskeren wordt vermeld in het vak.

Afwegingen

Het komt voor dat tekstfragmenten in documenten die openbaar gemaakt worden, niet gedeeld kunnen worden met het publiek. De Woo heeft voorzien in Grondslagen op basis waarvan dat mogelijk is. En ook de AVG is zo'n grondslag voor niet Woo-gebonden publicaties. Zonder het gebruik van de software zou het anonimiseren van tekstfragmenten in documenten significant meer tijd in beslag nemen. Het gebruik van de anonimiseringstool zorgt voor een versnelling en vereenvoudiging van het proces voor actieve en passieve openbaarmaking. Het geautomatiseerd anonimiseren is ook minder foutgevoelig dan menselijk handelen. Daardoor is de kans op een datalek kleiner en zijn de gegevens van personen beter beschermd.

Menselijke tussenkomst

Menselijke tussenkomst en controle is in het gebruik altijd de norm. De software werkt op basis van een inrichtingsdocument. De organisatie kan via dit inrichtingsdocument en verschillende mechanismen het algoritmegebruik afstemmen/parametriseren op de eigen unieke situatie. Er wordt een voorstel gedaan voor het anonimiseren van een tekstfragment aan een vakinhoudelijk persoon. Er is geen sprake van geautomatische beslissingen.

Het algoritme zoekt specifiek naar (persoons)gegevens en markeert deze of duidt ze aan ongeacht de verdere inhoud van documenten. De vakinhoudelijk persoon behandelt de voorstellen en geeft aan waar ze correct zijn, verbetert waar het moet. Eventueel kan dit werk ook binnen de software door een tweede persoon getoetst worden. Voor de burger betekent dit dat de organisatie aantoonbaar en proportioneel werkt aan het wegnemen van (de kans op) privacyschending en voldoen daarmee aan de AVG.

Risicobeheer

Om het risico dat documenten onvoldoende worden geanonimiseerd te mitigeren vindt er altijd controle door een mens plaats. Dit betreft een volledige controle waar de software op intuïtieve wijze gebruikt kan worden om te controleren of wijzigen/verrijken. Als er geen menselijke controle zou plaatsvinden bij het anonimiseren van documenten, kunnen er verschillende risico's ontstaan, met name als gevolg van het openbaar maken of publiceren van privacygevoelige gegevens. Deze tool in samenwerking met de mens, helpt dit te voorkomen:


Schending van Privacywetgeving:

Het onbedoeld openbaar maken van persoonlijke gegevens kan een schending van de privacywetgeving inhouden, zoals de AVG in de EU. Dit kan leiden tot aanzienlijke boetes en juridische sancties.


Identiteitsdiefstal:

Als persoonlijke identificeerbare informatie (PII) zoals namen, adressen en sofinummers openbaar wordt gemaakt, kan dit leiden tot identiteitsdiefstal en financiële fraude.


Schade aan reputatie:

Zowel de reputatie van de individuen wiens informatie is gelekt als die van de organisatie die verantwoordelijk is voor het lek kunnen ernstige schade oplopen.


Verlies van Vertrouwen:

Het vertrouwen van het publiek en de betrokken stakeholders in de organisatie kan afnemen, wat kan leiden tot een afname van de betrokkenheid en steun.


Persoonlijke Schade:

Individuen kunnen emotionele en psychologische schade ondervinden als hun persoonlijke gegevens, zoals medische of financiële informatie, openbaar worden gemaakt.


Exploitatie en Misbruik:

Openbaar gemaakte gegevens kunnen worden gebruikt voor kwaadwillende doeleinden, zoals staking, intimidatie of discriminatie.


Menselijke controle helpt om deze risico's te beperken door een extra laag van beoordeling en bevestiging te bieden dat de anonimiseringsprocessen adequaat zijn uitgevoerd voordat informatie openbaar wordt gemaakt.

Wettelijke basis

Algemene verordening gegevensbescherming (AVG)

Omgevingswet

Algemene Wet Bestuursrecht (AWB)

Bekendmakingswet

Wet Open Overheid (WOO)

Wet Elektronische Publicaties (WEP)

Links naar wettelijke basis

  • Algemene verordening gegevensbescherming (AVG): https://wetten.overheid.nl/BWBR0040940
  • Omgevingswet: https://wetten.overheid.nl/BWBR0037885
  • Algemene Wet Bestuursrecht (AWB): https://wetten.overheid.nl/BWBR0005537
  • Bekendmakingswet: https://wetten.overheid.nl/BWBR0004287
  • Wet Open Overheid (WOO): https://wetten.overheid.nl/BWBR0045754
  • Wet Elektronische Publicaties (WEP): https://wetten.overheid.nl/BWBR0043961

Werking

Gegevens

In het begin van het gebruik werd een inrichtingsdocument samengesteld door organisatie en leverancier. Hierin staan voorkeuren van de organisatie met betrekking tot het anonimiseren. Deze set wordt samengevoegd met het Basismodel van Octobox, dat standaard op zoek gaat naar personen te herleiden gegevens, zoals Burgerservicenummers, Bankrekeningnummers, telefoonnummers, e-mailadressen, datums, woonadressen en postcodes.

De organisatie kan een voorkeur hebben om bepaalde namen niet te lakken (bewindspersoon, directeur) en andere juist wel. De namen van medewerkers kunnen ontbreken in het Basismodel en alvast op voorhand worden toegevoegd. Een andere voorkeur die de organisatie kan aangeven is bijvoorbeeld het formaat waarin een e-mailadres onherkenbaar gemaakt wordt.

Technische werking

Op basis van slimme regels doorzoekt de software de teksten van elk document in het aangeboden dossier. Bepaalde teksten, woorden of karaktercombinaties worden herkend als naar personen te herleiden gegevens, zoals Burgerservicenummers, Bankrekeningnummers, telefoonnummers, e-mailadressen, datums, woonadressen en postcodes.

De software kan ingesteld worden op de mate van zekerheid waarin aan een voorwaarde voldaan wordt. Voor de medewerker wordt op het scherm aangegeven welke tekstfragmenten met zekerheid gelakt moeten worden, en welke in mindere mate aan de opgestelde slimme regel voldoet. Via het scherm kan de medewerker de voorstellen goed- of afkeuren, en ook wijzigen voor goedkeuring. Ook kan de medewerker zelf tekst markeren en voor aflakken in aanmerking laten komen, inclusief het toevoegen van een grondslag.

Het is mogelijk om een tweede medewerker het werk van de eerste te controleren. Als alle (pagina's van alle) documenten in het dossier zijn beoordeeld wordt de definitieve versie gecreëerd, in een geschikt formaat voor publicatie.

Leverancier

Octobox Nederland B.V.

Soortgelijke algoritmebeschrijvingen

  • Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.

    Laatst gewijzigd op 15 november 2024 om 13:58 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.

    Laatst gewijzigd op 6 augustus 2024 om 11:49 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.

    Laatst gewijzigd op 13 november 2024 om 13:53 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Het algoritme in de software herkent en anonimiseert persoonsgegevens en andere gevoelige informatie in documenten. Overheden publiceren regelmatig informatie die te maken heeft met het opstellen en uitvoeren van hun beleid (bijvoorbeeld op basis van de Woo). Deze tool wordt gebruikt om gevoelige gegevens daarbij onherkenbaar te maken.

    Laatst gewijzigd op 20 november 2024 om 14:27 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    DPIA
    Status
    In gebruik
  • Het algoritme anonimiseert documenten door persoonsgegevens te markeren. Een medewerker controleert of de anonimisatie correct is uitgevoerd. Na de goedkeuring van de medewerker verwijdert de software de gemarkeerde gegevens en worden deze zwartgelakt. Daarna kunnen de documenten, bijvoorbeeld in het kader van de WOO, gepubliceerd worden.

    Laatst gewijzigd op 24 september 2024 om 12:38 | Publicatiestandaard 1.0
    Publicatiecategorie
    Impactvolle algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    In gebruik