Octobox Anonimiseren
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- In gebruik
Algemene informatie
Thema
Begindatum
Contactgegevens
Verantwoord gebruik
Doel en impact
Octobox Anonimiseren helpt het ministerie om informatieverzoeken in het kader van de Woo sneller te verwerken en zodoende te voldoen aan wettelijke afhandelingstermijnen. Octobox doet suggesties voor het weglakken van persoonsgegevens en/of terugkerende te lakken passages. De impact van het gebruik van dit algoritme is laag: laksuggesties worden uitsluitend na menselijke controle overgenomen. Er is geen sprake van automatische beslissingen.
Afwegingen
Octobox Anonimiseren versnelt en vereenvoudigt een bestaand proces (actieve en passieve openbaarmaking) dat voorheen volledig handmatig verliep. Ook wordt de kwaliteit van het proces verhoogd omdat de handmatige werkwijze foutgevoeliger was. De kans op een datalek is kleiner en de gegevens van burgers en bedrijven beter beschermd.
Menselijke tussenkomst
Alle door Octobox Anonimiseren voorgestelde te lakken passages worden door een medewerker goedgekeurd, gewijzigd of afgekeurd. Er is geen sprake van automatische beslissingen.
Risicobeheer
Inzet van het algoritme brengt geen extra risico's met zich mee. Het gebruik versnelt en vereenvoudigt een bestaand proces en verhoogt de kwaliteit van te lakken documenten. De uitkomst van het proces is en blijft de verantwoordelijkheid van medewerkers van het ministerie.
Wettelijke basis
Algemene verordening gegevensbescherming (AVG)
Algemene Wet Bestuursrecht (AWB)
Bekendmakingswet
Wet Open Overheid (WOO)
Wet Elektronische Publicaties (WEP)
Links naar wettelijke basis
- Algemene verordening gegevensbescherming (AVG): https://wetten.overheid.nl/BWBR0040940
- Algemene wet bestuursrecht (AWB): https://wetten.overheid.nl/BWBR0005537
- Bekendmakingswet: https://wetten.overheid.nl/BWBR0004287
- Wet open overheid (WOO): https://wetten.overheid.nl/BWBR0045754
- Wet elektronische publicaties (WEP): https://wetten.overheid.nl/BWBR0043961
Toelichting op impacttoetsen
Er is een impactanalyse uitgevoerd, gebaseerd op het Implementatiekader 'Verantwoorde inzet Algoritmen' van het ministerie van Binnenlandse Zaken en Koninkrijksrelaties.
Uit deze impactanalyse concludeert het ministerie dat er geen sprake is van een hoog-risico algoritme en dat het gebruik van het algoritme geen significant effect heeft op betrokkenen (onder andere de indieners van Woo-verzoeken). Reden om het algoritme te publiceren is dat (de afhandeling van) Woo-verzoeken in het algemeen en het onleesbaar maken van passages in het bijzonder regelmatig onderwerp zijn van maatschappelijk debat.
Impacttoetsen
- Impact- en maatregelenanalyse Algoritmen
- Pre-scan DPIA
Werking
Gegevens
Het algoritme is in de basis getraind met openbare documenten en/of artikelen om specifiek entiteiten en namen te herkennen in verschillende soorten documenten en formats.
Technische werking
Octobox Anonimisering werkt op basis van open source Natutal Language Processing (NLP) van SpaCy, waarbij taal en kunstmatige intelligentie samenkomen. Onder meer kunnen teksten geclassificeerd worden door bijvoorbeeld te herkennen wat het onderwerp van een zin is of wat een werkwoord is. Binnen het model wordt gebruik gemaakt van Named Entity Recognition (NER) om bijvoorbeeld namen te herkennen. De open source bibliotheek YOLO (You Only Look Once) stelt in staat handtekeningen te herkennen. Verder worden technieken zoals Optical Character Recognition (OCR) toegepast om gevoelige gegevens die voldoen aan herkenbare formats (zoals telefoonnummers, BSN-nummers, IBAN-nummers, postcodes of e-mail adressen) te detecteren. De output van het algoritme betreft suggesties voor te lakken passages in documenten. Het algoritme leert op basis van menselijke correcties en toevoegingen.
Leverancier
Soortgelijke algoritmebeschrijvingen
- Herkennen en anonimiseren van privacygevoelige informatie in documenten.Laatst gewijzigd op 3 juli 2024 om 13:49 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.Laatst gewijzigd op 13 november 2024 om 13:53 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.Laatst gewijzigd op 6 augustus 2024 om 11:49 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.Laatst gewijzigd op 30 oktober 2024 om 15:57 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Het algoritme in de software is voornamelijk ingesteld op herkennen en anonimiseren van privacygevoelige informatie in documenten. Grondslag hiervan is de AVG. De tool wordt ook gebruikt om informatie die om andere reden niet gedeeld kan worden (op basis van een andere grondslag, bijvoorbeeld de Woo) te markeren en maskeren in een document.Laatst gewijzigd op 15 november 2024 om 13:58 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik