Anonimiseren
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
Algemene informatie
Thema
Begindatum
Contactgegevens
Link naar publiekspagina
Verantwoord gebruik
Doel en impact
Het doel van Octobox Anonimiseren is om de provincie Noord-brabant te ondersteunen bij het veilig en efficiënt lakken van privacygevoelige informatie in documenten. Octobox doet suggesties voor het lakken van te beschermen informatie. Medewerkers kunnen de voorstellen overnemen of afwijzen. Van automatische beslissingen is geen sprake, waardoor de impact laag is.
Afwegingen
Het gebruik van de anonimiseringstool zorgt voor een versnelling en vereenvoudiging van het proces voor passieve en de actieve openbaarmaking. Het geautomatiseerd anonimiseren is tevens minder foutgevoelig dan menselijk handelen. Daardoor is de kans op een datalek kleiner en zijn de gegevens van burgers en bedrijven beter beschermd. Octobox anonimiseren automatiseert dit proces, door het herkennen van te beschermen informatie. De inzet van Octobox is gerechtvaardigd omdat (opgeleide) medewerkers altijd de suggestie van Octobox moeten goedkeuren, wijzigen of afkeuren.
Menselijke tussenkomst
De software van Octobox werkt op basis van een door de provincie ingesteld inrichtingsdocument. De provincie kan middels dit inrichtingsdocument bepalen welke categorieën van informatie de software in concept lakt. Denk hierbij aan namen van mensen, BSN-nummers, of handtekeningen. De lakkende medewerker houdt de controle door een voorstel goed te keuren, te wijzigen of af te keuren.
Risicobeheer
Het grootste risico is dat informatie onjuist gelakt of per ongeluk toch openbaar wordt gemaakt, wat kan leiden tot schending van privacywetgeving (zoals de AVG), reputatieschade voor de provincie, of schade voor betrokken personen (zoals identiteitsdiefstal of misbruik van gegevens). Deze risico's worden gemitigeerd door verplichte menselijke controle: Octobox doet alleen suggesties en medewerkers maken de uiteindelijke beslissing. Daarnaast worden medewerkers opgeleid in het gebruik van Octobox en zijn er aanvullende richtlijnen beschikbaar.
Wettelijke basis
Algemene verordening gegevensbescherming (AVG), Algemene Wet Bestuursrecht (AWB), Bekendmakingswet, Wet open Overheid (WOO), Wet Elektronische Publicaties (WEP).
Werking
Gegevens
Het algoritme verwerkt complete documenten die worden beoordeeld op openbaarmaking, zoals Woo-verzoeken, beleidsdocumenten, rapporten of e-mails. Deze documenten kunnen alle soorten informatie bevatten, waaronder persoonsgegevens zoals namen, adressen, telefoonnummers, e-mailadressen, geboortedata, BSN-nummers, financiële gegevens of handtekeningen. Octobox scant het volledige document om mogelijke te beschermen informatie te detecteren. Het algoritme is dus niet beperkt tot specifieke gegevenscategorieën, maar werkt op de totale inhoud van het document.
Technische werking
Octobox Anonimiseren werkt op basis van 1) algoritmen om in de context van gegevens te zoeken 2) waardenlijsten waarmee termen automatisch herkend kunnen worden en 3) Natural Language Processing (NLP). NLP kan teksten classificeren door te herkennen wat het onderwerp van de zin is of wat bijvoorbeeld een werkwoord of naam is. De software maakt gebruik van onderliggende opensource engines zoals SpaCy en Yolo waarbij labels worden toegekend aan herkende entiteiten - deze worden vervolgens door Octobox nogmaals gevalideerd en indien binnen de confidence-zone zullen ze geaccepteerd worden ter beoordeling door gebruiker alvorens ze definitief worden gemaakt. en indien binnen de confidence-zone zullen ze geaccepteerd worden ter beoordeling door gebruiker alvorens ze definitief worden gemaakt.
Leverancier
Soortgelijke algoritmebeschrijvingen
- Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervoor is de AVG. De tool wordt ook gebruikt om informatie die om andere redenen niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.Laatst gewijzigd op 12 februari 2025 om 13:34 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.Laatst gewijzigd op 16 december 2025 om 13:48 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.Laatst gewijzigd op 26 november 2024 om 8:23 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.Laatst gewijzigd op 30 oktober 2024 om 15:57 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.Laatst gewijzigd op 24 januari 2025 om 12:34 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik