Anonimiseren

Op basis van taaltechnologie worden persoons- en bedrijfsnamen gelezen en uitgefilterd uit tekstbestanden als emails en losse documenten.

Laatst gewijzigd op 20 maart 2025 om 14:50 | Publicatiestandaard 1.0
Publicatiecategorie
Overige algoritmes
Impacttoetsen
Veld niet ingevuld.
Status
In gebruik

Algemene informatie

Thema

Organisatie en bedrijfsvoering

Begindatum

10-2024

Contactgegevens

info@pzh.nl

Verantwoord gebruik

Doel en impact

Ondersteuning in het beoordelingsproces waar wettelijke bescherming geldt op informatie die openbaar wordt gemaakt. Bescherming van de uitzonderingsgronden die zijn vastgelegd in de AVG- en Woo-wetgeving, zoals privacygevoelige persoons- en bedrijfsgegevens

Afwegingen

De handmatige beoordeling is intensief en foutgevoelig. Een suggestielijst vanuit het algoritme van entiteitsextractie brengt alle denkbare gevallen van personen in de tekst in beeld.

Menselijke tussenkomst

Binnen de software wordt een lijst opgebouwd en aangeboden aan de gebruiker om te selecteren in het automatische lakproces. De keuze om een geadviseerde term als persoonsnaam over te nemen en niet openbaar te maken, is aan de gebruiker die hier aan de hand van de context een beslissing over maakt. 

Risicobeheer

Er bestaat geen risico op geautomatiseerde besluitvorming en het algoritme heeft geen impact op grondrechten, omdat het algoritme geen besluiten neemt met rechtsgevolgen. Het doet alleen een voorstel voor het anonimiseren van persoonsgegevens. Het algoritme voorziet hiermee juist in de bescherming van grondrechten. De medewerker van de Provincie doet altijd de laatste toets of een document juist is geanonimiseerd.

Wettelijke basis

Wetgeving rond openbaarheid van overheidsdata (Woo)

Links naar wettelijke basis

Wet open overheid: https://wetten.overheid.nl/BWBR0045754/2023-04-01#Hoofdstuk5

Werking

Gegevens

Dit betreft documenten zoals benoemd in de Woo en berichteninformatie binnen de Provincie. Waaronder email, bestanden, Whatsapp-berichten en andere media waar bestuurlijke besluitvorming in gevonden kan worden. 

Links naar gegevensbronnen

Algemene Office applicaties: Dit betreft standaard Office formaten inclusief email en social media formaten.

Technische werking

Teksten worden op basis van Named Entity Recognition (NER) herkend en een proces binnen Insights extraheert de namen voor verdere afhandeling richting de beheerinterface en de automatische lakregels. 

Leverancier

ZyLAB eDiscovery & Compliance Services B.V.

Soortgelijke algoritmebeschrijvingen

  • Op basis van taaltechnologie worden persoons- en bedrijfsnamen gelezen en uitgefilterd uit tekstbestanden als emails en losse documenten.

    Laatst gewijzigd op 14 oktober 2024 om 10:47 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Op basis van taaltechnologie worden persoons- en bedrijfsnamen gelezen en uitgefilterd uit tekstbestanden als emails en losse documenten.

    Laatst gewijzigd op 5 februari 2025 om 9:14 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    DPIA
    Status
    In gebruik
  • Medewerkers kunnen gebruik maken van Microsoft 365 CoPilot als AI-chatbot om teksten te genereren en uitgebreid antwoord op vragen te krijgen. Enkele uitgangspunten beschreven in onze richtlijnen zijn dat er geen interne of vertrouwelijke informatie gebruikt mag worden en dat de informatie goed op juistheid moet worden gecontroleerd.

    Laatst gewijzigd op 27 maart 2025 om 13:24 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    DPIA, IAMA
    Status
    In gebruik
  • Het algoritme onderstreept de persoonsgegevens in documenten. Een medewerker moet alle pagina's bekijken en controleren of het document goed geanonimiseerd is. Daarna verwijdert de software alle gemarkeerde informatie en wordt het zwartgelakt. Daarna kunnen de documenten gepubliceerd worden, bijvoorbeeld op basis van de Wet Open Overheid (WOO).

    Laatst gewijzigd op 17 december 2024 om 14:22 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Het algoritme onderstreept de persoonsgegevens in documenten. Een medewerker moet alle pagina's bekijken en controleren of het document goed geanonimiseerd is. Daarna verwijdert de software alle gemarkeerde informatie en wordt het zwartgelakt. Daarna kunnen de documenten gepubliceerd worden, bijvoorbeeld op basis van de Wet open overheid (Woo).

    Laatst gewijzigd op 15 oktober 2024 om 10:13 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik