Zoekapplicatie cold cases

Dit algoritme helpt bij het terugvinden van informatie in cold case-dossiers. Het gebruikt een taalmodel om te zoeken op de betekenis van woorden en niet alleen op de exacte woorden.

Laatst gewijzigd op 28 januari 2025 om 13:28 | Publicatiestandaard 1.0
Publicatiecategorie
Overige algoritmes
Impacttoetsen
DPIA, ...
Status
In gebruik

Algemene informatie

Thema

Openbare orde en veiligheid

Begindatum

2024-09

Contactgegevens

https://www.politie.nl/

Verantwoord gebruik

Doel en impact

Het algoritme helpt rechercheurs bij het vinden van informatie in een cold case-dossier. In plaats van te zoeken op exacte woorden (zoals met CTRL-F), zoekt het naar de betekenis van woorden. Dit maakt het mogelijk om sneller en vollediger informatie te vinden.

Afwegingen

Het gaat hier om het recht doen aan slachtoffers en de nabestaanden van het slachtoffer. De politie wil blijven onderzoeken of er kansen zijn om een cold case op te lossen. De dossiers zijn door de handen van meerdere rechercheurs gegaan. Dit kan het terugvinden van informatie lastig en tijdrovend maken. Met de zoekapplicatie cold cases kan informatie veel sneller gevonden worden.


Menselijke tussenkomst

Rechercheurs beginnen met het lezen van het dossier om de cold case goed te begrijpen. Soms willen ze informatie die ze eerder hebben gelezen terugvinden, of ze zoeken naar nieuwe details. De zoekapplicatie cold cases helpt hierbij door snel stukken uit het dossier te vinden die belangrijk zijn. Bij de zoekresultaten worden de woorden/zinnen die een semantische relatie hebben met de zoekopdracht getoond. De rechercheur kan daardoor bepalen welk zoekresultaat relevant is en kan vanaf het zoekresultaat het originele bestand inlezen. Deze informatie kan de rechercheur verder helpen in het onderzoek.

Risicobeheer

Er is een Data Protection Impact Assessment (DPIA) en er is een ethische quickscan uitgevoerd. Daarnaast zijn een plan van aanpak en evaluatie Ethiek & Recht opgesteld (op basis van de Ethische richtsnoeren voor betrouwbare AI) en is het Algoritmekader van de Algemene Rekenkamer nagelopen. Op basis van de risico's en aanbevelingen zijn maatregelen genomen.

Wettelijke basis

Artikel 8 Wpg als het gaat om mutaties in het kader van de reguliere politiepraktijk.


Artikel 9 Wpg als het gaat om de processen-verbaal die zijn opgesteld van het initiële onderzoek.


Links naar wettelijke basis

Wet politiegegevens: https://wetten.overheid.nl/jci1.3:c:BWBR0022463&paragraaf=2&artikel=8&z=2023-11-01&g=2023-11-01

Impacttoetsen

  • Data Protection Impact Assessment (DPIA)
  • Quickscan ethiek

Werking

Gegevens

Het algoritme gebruikt een opensource taalmodel dat alleen Nederlands ondersteunt. Er is geen politiedata gebruikt bij de ontwikkeling van dit model.

Technische werking

De gebruiker selecteert een cold case-dossier om daarin te zoeken. De gebruiker voert een zoekopdracht in via de user interface, in de vorm van tekst. Deze tekst wordt omgezet in een vector die de betekenis van de zin weergeeft. Vervolgens wordt de ‘afstand’ berekend tussen deze vector en de vectoren van zinnen of paragrafen uit het dossier. Het resultaat dat het dichtst bij de ingevoerde zoekopdracht ligt, wordt gezien als het meest relevant.

De zoekresultaten worden gepresenteerd in een lijst, gerangschikt op relevantie. Bij elk resultaat worden de zin of paragraaf, de bron, en het paginanummer van het document weergegeven. De woorden of zinsdelen die volgens het algoritme een semantische relatie hebben met de zoekopdracht van de gebruiker worden geel gearceerd.

De zoekopdracht wordt niet opgeslagen in de Elasticsearch-database. Mogelijk wordt deze wél tijdelijk in de user interface opgeslagen, zodat de gebruiker eerdere zoekopdrachten kan bekijken.

Leverancier

Open source

Soortgelijke algoritmebeschrijvingen

  • Algoritme dat het mogelijk maakt om fonetisch (gegevens schrijven zoals ze klinken) te zoeken op persoonsgegevens van vreemdelingen die geregistreerd zijn in de Basisvoorziening Vreemdelingen (BVV).

    Laatst gewijzigd op 21 december 2023 om 15:38 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Dit algoritme heeft een laag impact. Het op woorden doorzoekbaar maken van historische handgeschreven documenten.

    Laatst gewijzigd op 24 juni 2024 om 7:00 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Dit algoritme heeft een laag impact. Het op woorden doorzoekbaar maken van historische handgeschreven documenten.

    Laatst gewijzigd op 9 december 2024 om 14:25 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Dit algoritme gebruiken wij ter ondersteuning bij het beslissen op uitkeringsaanvragen, het registreren van de uitkomsten en het produceren van documenten.

    Laatst gewijzigd op 25 juni 2024 om 14:35 | Publicatiestandaard 1.0
    Publicatiecategorie
    Impactvolle algoritmes
    Impacttoetsen
    DPIA
    Status
    In gebruik
  • Het zoekalgoritme dat gehanteerd wordt door de beheervoorziening BSN om te zoeken naar personen op basis van identificerende gegevens.

    Laatst gewijzigd op 25 september 2024 om 13:20 | Publicatiestandaard 1.0
    Publicatiecategorie
    Overige algoritmes
    Impacttoetsen
    DPIA
    Status
    In gebruik