Anonimiseren
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- DPIA
- Status
- In gebruik
Algemene informatie
Thema
Begindatum
Contactgegevens
Verantwoord gebruik
Doel en impact
De software voor anonimiseren helpt de gemeente om documenten sneller en beter te beschermen. Hierdoor voorkomen wij datalekken. Daarnaast zorgen wij voor een betere bescherming van de rechten van mensen volgens de AVG.
Afwegingen
De gemeente moet vaker informatie openbaar maken. Daarom moet gevoelige informatie worden weggelakt. Voor het gebruik van het algoritme ging dit lakken soms niet goed. Er kunnen datalekken ontstaan als niet alle persoonlijke gegevens goed worden weggelakt of waarbij weggelakte informatie nog zichtbaar is. Het voordeel van de software is dat het sneller en beter anonimiseren mogelijk maakt.
Menselijke tussenkomst
Risicobeheer
Er bestaat geen risico op geautomatiseerde besluitvorming en het algoritme heeft geen impact op grondrechten, omdat het algoritme geen besluiten neemt met rechtsgevolgen. Het doet alleen een voorstel voor het anonimiseren van persoonsgegevens. Wanneer het algoritme niet goed genoeg werkt, kunnen wij met een zogenaamde white- en blacklist bijsturen. De medewerker van de gemeente doet altijd de laatste toets of een document goed is geanonimiseerd. Het risico bestaat dat medewerkers niet goed controleren, dit verminderen wij door aandacht te geven aan het belang van een goede controle van de gevonden persoonsgegevens. Het laatste risico dat overblijft, is het privacyrisico van Azure van Microsoft. Omdat Microsoft verplicht kan worden gegevens die het verwerkt over te dragen aan de Amerikaanse autoriteiten vanwege de zogenaamde Patriot Act. Om deze risico's te beperken heeft de leverancier privacy by default toegepast. Onmiddellijk na de verwerking wordt de data en de dataverwerking verwijderd. Verder is de leverancier ISO 27001 gecertificeerd. De risico's wegen niet op tegen de privacyvoordelen en het risico van gebrekkig anonimiseren door deze software niet te gebruiken.
Wettelijke basis
1. Woo. 2. WDO. 3. UAVG. 4. WEP.
Impacttoetsen
Werking
Gegevens
Alle informatie die te vinden is in de geuploade documenten wordt verwerkt door het algoritme (behalve de metadata). Het kan daarbij gaan om gewone persoonsgegevens, bijzondere persoonsgegevens of strafrechtelijke persoonsgegevens. Het kan ook gaan om bedrijfsgevoelige informatie. Onmiddellijk na de verwerking wordt de data en de dataverwerking verwijderd.
Technische werking
Documenten worden door een medewerker geupload naar de applicatie. Op dat moment wordt een kopie gemaakt van het origineel in de vorm van een PDF met tekstlaag en wordt de metadata van het oorspronkelijke document uit de kopie verwijderd. Deze kopie komt op een Nederlandse server terecht en blijft daar maximaal 30 dagen staan. De tekstlaag van de PDF wordt door een API aangeboden aan het algoritme. Het gaat om een zogenaamde Natural Language Processing algoritme van Microsoft Azure. De API levert terug op welke locatie in de geanalyseerde teksten waarschijnlijk een persoonsgegeven voorkomt, samen met de waarschijnlijkheidsscore (een percentage). Op dat moment wordt de tekstlaag bij Azure direct verwijderd. De waarschijnlijkheidsscore wordt samen met door de leverancier ontwikkelde eigen ai-modellen gebruikt om de herkenning van persoonsgegevens zo accuraat mogelijk te kunnen doen.
Tot slot controleert een medewerker het document en wanneer deze het document afrondt, worden de te anonimiseren gegevens definitief uit de tekstlaag verwijderd en wordt een zwart balkje geplaatst.
Leverancier
Soortgelijke algoritmebeschrijvingen
- Het algoritme onderstreept de persoonsgegevens in documenten. Een medewerker moet alle pagina's bekijken en controleren of het document goed geanonimiseerd is. Daarna verwijdert de software alle gemarkeerde informatie en wordt het zwartgelakt. Daarna kunnen de documenten gepubliceerd worden, bijvoorbeeld op basis van de Wet Open Overheid (WOO).Laatst gewijzigd op 19 december 2025 om 8:13 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- DPIA
- Status
- In gebruik
- Het algoritme onderstreept de persoonsgegevens in documenten. Een medewerker moet alle pagina's bekijken en controleren of het document goed geanonimiseerd is. Daarna verwijdert de software alle gemarkeerde informatie en wordt het zwartgelakt. Daarna kunnen de documenten gepubliceerd worden, bijvoorbeeld op basis van de Wet Open Overheid (WOO).Laatst gewijzigd op 28 augustus 2025 om 11:47 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Het algoritme onderstreept de persoonsgegevens in documenten. Een medewerker moet alle pagina's bekijken en controleren of het document goed geanonimiseerd is. Daarna verwijdert de software alle gemarkeerde informatie en wordt het zwartgelakt. Daarna kunnen de documenten gepubliceerd worden, bijvoorbeeld op basis van de Wet Open Overheid (WOO).Laatst gewijzigd op 12 december 2025 om 9:52 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- DPIA
- Status
- In gebruik
- Het algoritme onderstreept de persoonsgegevens in documenten. Een medewerker moet alle pagina's bekijken en controleren of het document goed geanonimiseerd is. Daarna verwijdert de software alle gemarkeerde informatie en wordt het zwartgelakt. Daarna kunnen de documenten gepubliceerd worden, bijvoorbeeld op basis van de Wet Open Overheid (WOO).Laatst gewijzigd op 11 maart 2026 om 14:55 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Het algoritme onderstreept de persoonsgegevens in documenten. Een medewerker moet alle pagina's bekijken en controleren of het document goed geanonimiseerd is. Daarna verwijdert de software alle gemarkeerde informatie en wordt het zwartgelakt. Daarna kunnen de documenten gepubliceerd worden, bijvoorbeeld op basis van de Wet Open Overheid (WOO).Laatst gewijzigd op 7 januari 2026 om 13:59 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik