Tekstanalyse

Op basis van taaltechnologie worden persoons- en bedrijfsnamen gelezen en uitgefilterd uit tekstbestanden als emails en losse documenten.

Laatst gewijzigd op 14 oktober 2024 om 10:47 | Publicatiestandaard 1.0
Publicatiecategorie
Overige algoritmes
Impacttoetsen
Veld niet ingevuld.
Status
In gebruik

Algemene informatie

Thema

Organisatie en bedrijfsvoering

Begindatum

januari

Contactgegevens

info@waterschaplimburg.nl

Link naar publiekspagina

open.waterschaplimburg.nl

Verantwoord gebruik

Doel en impact

Ondersteuning in het beoordelingsproces waar wettelijke bescherming geldt op informatie die openbaar wordt gemaakt. Bescherming vanuit de AVG- (personen) en Woo-wetgeving (vooral bedrijfsvertrouwelijk), waar uitzonderingsgronden in benoemd worden.

Afwegingen

De handmatige beoordeling is intensief en foutgevoelig. Een suggestielijst vanuit het algoritme van entiteitsextractie brengt alle denkbare gevallen van personen in de tekst in beeld.

Menselijke tussenkomst

Binnen de software wordt een lijst opgebouwd en aangeboden aan de gebruiker om te selecteren in het automatische lakproces. De keuze om een geadviseerde term als persoonsnaam over te nemen en niet openbaar te maken, is aan de gebruiker.

Risicobeheer

Er bestaat geen risico op geautomatiseerde besluitvorming en het algoritme heeft geen impact op grondrechten, omdat het algoritme geen besluiten neemt met rechtsgevolgen. Het doet alleen een voorstel voor het anonimiseren van persoonsgegevens. De medewerker van het bestuursorgaan doet altijd de laatste toets of een document juist is geanonimiseerd. 

Wettelijke basis

Wetgeving rond openbaarheid van overheidsdata (Woo)

Links naar wettelijke basis

Wet open overheid: https://wetten.overheid.nl/BWBR0045754/2023-04-01#Hoofdstuk5

Werking

Gegevens

Dit betreft documenten en berichteninformatie binnen Rijksoverheden. Waaronder email, bestanden, Whatsapp-berichten en andere media waar bestuurlijke besluitvorming in gevonden kan worden. 

Links naar gegevensbronnen

Algemene Office applicaties: Dit betreft standaard Office formaten inclusief email en social media formaten.

Technische werking

Teksten worden op basis van Named Entity Recognition (NER) herkend en een proces binnen Insights extraheert de namen voor verdere afhandeling richting de beheerinterface en de automatische lakregels. 

Leverancier

ZyLAB eDiscovery & Compliance Services B.V.

Soortgelijke algoritmebeschrijvingen

  • Het algoritme onderstreept de persoonsgegevens in documenten. Een medewerker moet alle pagina's bekijken en controleren of het document goed geanonimiseerd is. Daarna verwijdert de software alle gemarkeerde informatie en wordt het zwartgelakt. Daarna kunnen de documenten gepubliceerd worden, bijvoorbeeld op basis van de Wet open overheid (Woo).

    Laatst gewijzigd op 15 oktober 2024 om 10:13 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Het algoritme onderstreept de persoonsgegevens in documenten. Een medewerker moet alle pagina's bekijken en controleren of het document goed geanonimiseerd is. Daarna verwijdert de software alle gemarkeerde informatie en wordt het zwartgelakt. Daarna kunnen de documenten gepubliceerd worden, bijvoorbeeld op basis van de Wet Open Overheid (WOO).

    Laatst gewijzigd op 17 december 2024 om 14:22 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Het algoritme onderstreept de persoonsgegevens in documenten. Een medewerker moet alle pagina's bekijken en controleren of het document goed geanonimiseerd is. Daarna verwijdert de software alle gemarkeerde informatie en wordt het onherstelbaar zwartgelakt. Daarna kunnen de documenten gepubliceerd worden, bijv. op basis van de Wet Open Overheid.

    Laatst gewijzigd op 30 september 2024 om 13:43 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    DPIA, ...
    Status
    In gebruik
  • Dit algoritme heeft een laag impact. Het op woorden doorzoekbaar maken van historische handgeschreven documenten.

    Laatst gewijzigd op 9 december 2024 om 14:25 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Dit algoritme heeft een laag impact. Het op woorden doorzoekbaar maken van historische handgeschreven documenten.

    Laatst gewijzigd op 24 juni 2024 om 7:00 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik