Anonimiseren

Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo te markeren en maskeren in een document.

Laatst gewijzigd op 3 februari 2026 om 9:17 | Publicatiestandaard 1.0
Publicatiecategorie
Overige algoritmes
Impacttoetsen
Veld niet ingevuld.
Status
In gebruik

Algemene informatie

Thema

Organisatie en bedrijfsvoering

Begindatum

01-2024

Contactgegevens

algoritmeregister@brabant.nl

Link naar publiekspagina

https://www.brabant.nl/loket/producten-diensten/overheidsinformatie-opvragen-woo/#collapsable-334684

Verantwoord gebruik

Doel en impact

Het doel van Octobox Anonimiseren is om de provincie Noord-brabant te ondersteunen bij het veilig en efficiënt lakken van privacygevoelige informatie in documenten. Octobox doet suggesties voor het lakken van te beschermen informatie. Medewerkers kunnen de voorstellen overnemen of afwijzen. Van automatische beslissingen is geen sprake, waardoor de impact laag is.

Afwegingen

Het gebruik van de anonimiseringstool zorgt voor een versnelling en vereenvoudiging van het proces voor passieve en de actieve openbaarmaking. Het geautomatiseerd anonimiseren is tevens minder foutgevoelig dan menselijk handelen. Daardoor is de kans op een datalek kleiner en zijn de gegevens van burgers en bedrijven beter beschermd. Octobox anonimiseren automatiseert dit proces, door het herkennen van te beschermen informatie. De inzet van Octobox is gerechtvaardigd omdat (opgeleide) medewerkers altijd de suggestie van Octobox moeten goedkeuren, wijzigen of afkeuren.

Menselijke tussenkomst

De software van Octobox werkt op basis van een door de provincie ingesteld inrichtingsdocument. De provincie kan middels dit inrichtingsdocument bepalen welke categorieën van informatie de software in concept lakt. Denk hierbij aan namen van mensen, BSN-nummers, of handtekeningen. De lakkende medewerker houdt de controle door een voorstel goed te keuren, te wijzigen of af te keuren.

Risicobeheer

Het grootste risico is dat informatie onjuist gelakt of per ongeluk toch openbaar wordt gemaakt, wat kan leiden tot schending van privacywetgeving (zoals de AVG), reputatieschade voor de provincie, of schade voor betrokken personen (zoals identiteitsdiefstal of misbruik van gegevens). Deze risico's worden gemitigeerd door verplichte menselijke controle: Octobox doet alleen suggesties en medewerkers maken de uiteindelijke beslissing. Daarnaast worden medewerkers opgeleid in het gebruik van Octobox en zijn er aanvullende richtlijnen beschikbaar.

Wettelijke basis

Algemene verordening gegevensbescherming (AVG), Algemene Wet Bestuursrecht (AWB), Bekendmakingswet, Wet open Overheid (WOO), Wet Elektronische Publicaties (WEP).

Werking

Gegevens

Het algoritme verwerkt complete documenten die worden beoordeeld op openbaarmaking, zoals Woo-verzoeken, beleidsdocumenten, rapporten of e-mails. Deze documenten kunnen alle soorten informatie bevatten, waaronder persoonsgegevens zoals namen, adressen, telefoonnummers, e-mailadressen, geboortedata, BSN-nummers, financiële gegevens of handtekeningen. Octobox scant het volledige document om mogelijke te beschermen informatie te detecteren. Het algoritme is dus niet beperkt tot specifieke gegevenscategorieën, maar werkt op de totale inhoud van het document.

Technische werking

Octobox Anonimiseren werkt op basis van 1) algoritmen om in de context van gegevens te zoeken 2) waardenlijsten waarmee termen automatisch herkend kunnen worden en 3) Natural Language Processing (NLP). NLP kan teksten classificeren door te herkennen wat het onderwerp van de zin is of wat bijvoorbeeld een werkwoord of naam is. De software maakt gebruik van onderliggende opensource engines zoals SpaCy en Yolo waarbij labels worden toegekend aan herkende entiteiten - deze worden vervolgens door Octobox nogmaals gevalideerd en indien binnen de confidence-zone zullen ze geaccepteerd worden ter beoordeling door gebruiker alvorens ze definitief worden gemaakt. en indien binnen de confidence-zone zullen ze geaccepteerd worden ter beoordeling door gebruiker alvorens ze definitief worden gemaakt.

Leverancier

Octobox Nederland B.V.

Soortgelijke algoritmebeschrijvingen

  • Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervoor is de AVG. De tool wordt ook gebruikt om informatie die om andere redenen niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.

    Laatst gewijzigd op 12 februari 2025 om 13:34 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.

    Laatst gewijzigd op 16 december 2025 om 13:48 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.

    Laatst gewijzigd op 26 november 2024 om 8:23 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.

    Laatst gewijzigd op 30 oktober 2024 om 15:57 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.

    Laatst gewijzigd op 24 januari 2025 om 12:34 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik