Meldingen openbare ruimte
- Publicatiecategorie
- Impactvolle algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
Algemene informatie
Thema
Begindatum
Contactgegevens
Link naar publiekspagina
Verantwoord gebruik
Doel en impact
Als er op straat of in een park iets gerepareerd of opgeruimd moet worden, dan kan dat bij de gemeente worden gemeld via Signalen, het open source meldingensysteem van, voor en door gemeenten. Ook een gevaarlijke verkeerssituatie, woonoverlast of overlast van personen en horeca kan gemeld worden. Voorheen moesten mensen zelf kiezen bij welke categorie hun melding het beste paste (bijvoorbeeld ‘overlast’ of ‘straatmeubilair’), zodat de melding bij de juiste afdeling van de gemeente terecht kwam. Maar de gemeente is een complexe organisatie en de lijst met categorieën is lang. Daardoor was het soms lastig om de juiste categorie te vinden. Dat zorgde soms voor vertraging in de afhandeling van meldingen. Daarom gebruiken we nu een algoritme dat woorden herkent, bijvoorbeeld ‘afval’ en ‘stoep’. Op basis daarvan wordt bepaald bij welke categorie de melding het beste past en welke afdeling de melding moet afhandelen. De melder hoeft dus geen categorie meer te kiezen, en de melding wordt sneller afgehandeld omdat hij bij de juiste afdeling terecht komt.
Afwegingen
Menselijke tussenkomst
Alle meldingen die met minder dan 40% zekerheid bij een bepaalde categorie “overig’’ ingedeeld worden, komen terecht bij de afdeling Service & Informatie (S&I). Daar beoordeelt één van de medewerkers de melding en wordt de melding alsnog gecategoriseerd. Ook de meldingen die onterecht doorgestuurd worden naar een verkeerde categorie, worden door de verantwoordelijke afdeling (soms via het S&I team) handmatig in de juiste categorie geplaatst.
Risicobeheer
Er zitten weinig risico’s aan dit algoritme. Het plaatst een melding in de juiste categorie en zorgt dat het sneller bij de juiste afdeling onder de aandacht is. Als het algoritme een melding niet met voldoende zekerheid in een categorie kan plaatsen, komt hij in de categorie ‘Overig’ terecht. Medewerkers van het S&I team bekijken die meldingen en zetten ze handmatig in de juiste categorie. Als het algoritme niet naar behoren werkt, duurt het dus iets langer voordat de melding bij de juiste afdeling is. De melder kan persoonsgegevens toevoegen als hij of zij op de hoogte gehouden wil worden. Deze gegevens worden beveiligd opgeslagen en niet door het algoritme gebruikt.
Werking
Gegevens
Meldingen
De dataset bestaat uit meldingen die eerder gedaan zijn. In eerste instantie hebben we meldingen uit het verleden gebruikt om het algoritme te trainen. Regelmatig wordt het bijgetraind met nieuwe meldingen en uitgevoerde correcties op bestaande meldingen. Als het S&I-team of afdelingen een verkeerde categorisering zien, (zie Menselijk toezicht) corrigeren zij dit handmatig in het meldingensysteem. Deze correcties worden gebruikt bij het bijtrainen. De applicatie Signalen is nog in ontwikkeling. Er wordt onderzocht of het bijtrainen van het algoritme in de toekomst geautomatiseerd kan.
Deze dataset kunnen we in dit register niet openbaar maken. Omdat de data uit een vrij tekstveld komen, kunnen daar persoonsgegevens in staan, hoewel daar expliciet niet om wordt gevraagd.
E-mailadres en telefoonnummer voor vervolgvragen
Iemand die een melding doet, kan een telefoonnummer en/of e-mailadres achterlaten. We houden de melder dan op de hoogte van de voortgang en we hebben de mogelijkheid om deze persoon terug te bellen. Deze informatie wordt niet langer bewaard dan voor dit doel nodig is en wordt dus niet door het algoritme gebruikt. De contactgegevens worden na verloop van een jaar geanonimiseerd en meldingen die afgehandeld zijn worden na vijf jaar in zijn geheel verwijderd.
Voor overige informatie over verwerking van persoonsgegevens, zie: https://www.leeuwarden.nl/privacy-en-avg/privacy/
Technische werking
Architectuur van het model
De tekst van de melding wordt opgedeeld in losse woorden. Van elk woord uit een melding wordt geanalyseerd hoe uniek het is voor die melding, afgezet tegen de totale collectie woorden (‘TF-IDF’ of ‘term frequency-inverse document frequency’). Een woord als ‘de’ of ‘bedankt’ krijgt daardoor een laag gewicht en een woord als ‘vuilnis’ krijgt een hoger gewicht.
Van die combinatie van woorden wordt vervolgens met logistische regressie (een machine-learning-techniek) bepaald bij welke categorie de melding hoort en daarmee bij welke afdeling binnen de gemeente de melding het meest waarschijnlijk past.