Intelligent zoeken in de Beheervoorziening BSN
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- DPIA
- Status
- In gebruik
Algemene informatie
Thema
Begindatum
Contactgegevens
Link naar publiekspagina
Verantwoord gebruik
Doel en impact
Het doel van dit algoritme is om de kwaliteit van het zoekproces in de Beheervoorziening BSN zo hoog mogelijk te maken.
De Beheervoorziening BSN biedt meerdere diensten waarbij gezocht moet worden naar de juiste persoon:
- UC12 Match identificerende gegevens (In de BRP bekend onder de naam Presentievraag);
- UC23 Opvragen BSN op basis van identificerende gegevens
- UC35 Opvragen BSN t.b.v. schoning en initiële vulling
- UC37 Verwerken bulkvraag
Bij al deze diensten is het belangrijk dat de juiste persoon gevonden wordt als die in de Beheervoorziening BSN geregistreerd is. Het algoritme implementeert een vorm van 'intelligent' zoeken, waarbij naast het 1-op-1 zoeken met de ingevoerde gegevens ook een aantal bewerkingen op de ingevoerde gegevens uitgevoerd worden alvorens te zoeken. Dit verhoogt dat kans dat de gezochte persoon gevonden wordt als die in de database aanwezig is (vermindert de vals-negatieven). Tegelijkertijd zorgt het algoritme ervoor dat de kans zo klein is dat de verkeerde persoon gewonden wordt (vermindert de vals-positieven).
Afwegingen
Als er geen intelligent zoekalgoritme ingezet zou worden, dan vindt het zoeken van personen plaats op basis van een 1-op-1 vergelijking van de ingevoerde zoekgegevens met de persoonsgegevens in de database. De ervaring leert echter dat de gebruikers van de Beheervoorziening lang niet altijd beschikken over exact dezelfde data als in de database aanwezig zijn. Veel organisaties beschikken bijvoorbeeld niet over de volledige voornamen van de persoon, maar hebben alleen de voorletters, of uitsluitend de eerste voornaam voluit. Ook komt het vaak voor dat diakritische tekens zoals ã, â, ä of ligaturen zoals Ӕ niet of niet correct geregistreerd. Verder zijn er veel verschillende schrijfwijzen in omloop van (vooral) buitenlandse namen. Bij een 1-op-1 vergelijking zouden deze zoekvragen ten onrechte leiden tot het antwoord Niet Gevonden; we noemen dit een vals-negatief resultaat. De introductie van een vorm van intelligent zoeken vergroot in dit geval de trefkans, en vermindert daarmee het percentage vals-negatief.
Tegelijkertijd kan een dergelijk zoekalgoritme de kans op vals-positieven vergroten, doordat er personen gevonden kunnen worden die niet aan de bedoelde zoekvraag voldoen.
Bij de afweging van de voordelen tegenover de nadelen is ervoor gekozen om maatregelen toe te voegen die het onterecht gebruik van een vals-positief resultaat zo veel mogelijk uitsluiten. Daarmee ontstaat er een balans tussen het voorkómen van vals-negatieven zonder dat tegelijkertijd het percentage vals-positieven te groot wordt.
Menselijke tussenkomst
De uitkomst van het zoekresultaat wordt aan de gebruiker, een mens die de zoekvraag gesteld heeft, aangeboden. In het antwoord wordt ook meegestuurd of het resultaat een 100% match is (alle verplichte gegevens komen volledig overeen) of een lager percentage (zie bij Technische werking). Op basis van die uitkomst kan de gebruiker beoordelen of het juiste antwoord in het zoekresultaat staat, of dat een bijgestelde vraag noodzakelijk. Er is documentatie aanwezig om de gebruiker daarbij te ondersteunen: Handreiking BSN voor gebruikers, Handreiking BSN Burgerzaken en RNI en Functionele specificaties BV BSN.
Risicobeheer
Er vindt op regelmatige basis overleg plaats met de gebruikers van de Beheervoorziening BSN waarin o.a. aan de orde komt wat de tevredenheid is over de aangeboden diensten. De ervaren kwaliteit van het zoekalgoritme is daar onderdeel van. Bij RvIG is een applicatiebeheerteam aanwezig dat onder leiding van de product owner vragen, wensen en eventuele storingen afhandelt.
Wettelijke basis
Op het niveau van de wet is dit de Wet algemene bepalingen burgerservicenummer. Daaronder het Besluit burgerservicenummer. Daaronder de Regeling burgerservicenummer, waar in artikel 3 het Logisch Ontwerp BSN aangewezen wordt als systeembeschrijving. In dit Logisch Ontwerp is de werking van het zoekalgoritme beschreven.
Links naar wettelijke basis
- Wet algemene bepalingen burgerservicenummer: https://wetten.overheid.nl/BWBR0022428
- Besluit burgerservicenummer: https://wetten.overheid.nl/BWBR0022829
- Regeling burgerservicenummer: https://wetten.overheid.nl/BWBR0022835
Toelichting op impacttoetsen
De Beheervoorziening BSN is ontworpen en gebouwd in de jaren 2005-2007. In die periode waren (D)PIA's nog niet gebruikelijk. Op dit moment werkt RvIG aan het updaten van de bestaande (D)PIA's en het aanvullen van ontbrekende (D)PIA's. In die werklijst wordt de Beheervoorziening BSN ook meegenomen.
Impacttoetsen
Werking
Gegevens
De maximale set zoekgegevens die ingevoerd kan worden in de verschillende zoekalgoritmen bestaat uit:
- Naam: voornamen, voorvoegsels, geslachtsnaam
- Geboorte: geboortedatum, geboorteplaats, geboorteland
- Geslachtsaanduiding
- Nationaliteit
- Adres: gemeente, straatnaam, huisnummer, huisletter, huisnummertoevoeging, postcode
- Land vanwaar ingeschreven
- Datum vertrek uit Nederland
Links naar gegevensbronnen
Technische werking
Er kunnen verschillende zoekmethoden onderscheiden worden:
- Exacte match: Het opgegeven veld komt exact overeen met het gevonden veld. Deze zoekmethode zal voor alle opgegeven velden gebruikt worden.
- Diakrietentransformatie: Het opgegeven veld komt, na diakrietentransformatie, exact overeen met het gevonden veld (dat volgens dezelfde methode is ontdaan van zijn diakrieten). In onderstaande tabel staat aangegeven voor welke velden diakrietentransformatie wordt toegepast. In de notitie “Diakrieten” is reeds beschreven hoe moet worden omgegaan met de transformatie van diakrieten.
- Overige zoekmethoden: Er zijn verschillende zoekmethoden per veld onderscheiden. Deze staan in de tweede tabel. Bij het selecteren van de zoekmethoden, zijn de volgende uitgangspunten gehanteerd:
- Er wordt uitgegaan van een goed identificeerbare persoon (liefst met identiteitsdocument), die aan het loket geïdentificeerd wordt;
- Tikfouten worden niet opgelost met de voorgestelde zoekmethoden.
De diakrietentransformatie wordt als volgt uitgevoerd:
- Alle diakritische tekens worden verwijderd en een aantal bijzondere lettertekens (bv. Ǽ) wordt omgezet naar een corresponderend teken of tekens in de range ‘a’ tot en met ‘z’. Dit gebeurt volgens een vertaaltabel (zie conversietabellen).
- Alle (normale) hoofdletters A tot en met Z worden omgezet naar de overeenkomstige kleine letters.
- Alle resterende karakters, niet zijnde de cijfers ‘0’ tot en met ‘9’ en de letters ‘a’ tot en met ‘z’, worden omgezet naar spaties waarna alle spaties worden verwijderd.
Zoeken op voornamen:
- Het is mogelijk om alleen op die voornaam/voornamen te zoeken, die in de vraag zijn opgegeven. Dit betekent dat als slechts één voornaam is opgegeven, deze wordt vergeleken met de eerste voornaam in het veld voornamen en als er twee voornamen zijn opgegeven, deze worden vergeleken met de eerste twee voornamen in het veld voornamen, etc. De opgegeven volgorde en de in de registratie vastgelegde volgorde moeten exact aan elkaar gelijk zijn.
- Er wordt alleen op eerste voorletter gezocht als slechts 1 positie in het veld voornamen is opgegeven. Het opgegeven karakter wordt vergeleken met de eerste positie van het veld in de registratie (na diakrietentransformatie).
Zoeken op geslachtsnaam:
Op basis van een conversietabel wordt de opgegeven naam vergeleken met het veld Geslachtsnaam in de registraties. Uitgangspunten hierbij zijn:
- Gericht op het oplossen van verschillen in buitenlandse geslachtsnamen, omdat de verwachting is dat Nederlandse geslachtsnamen goed gedocumenteerd (paspoort, rijbewijs) zijn;
- -De omzetting is met name gericht op transliteratie en transscriptie. Hiermee worden gedeeltelijk verschillen in het omzetten van niet Romaanse schriften opgelost. (In Russische paspoorten is bijvoorbeeld vaak het cyrillisch omgezet volgens een Franse transliteratie. Deze verschilt van de Nederlandse of Engelse transliteratie);
- Er is met name aandacht besteed aan de omzetting van cyrillisch (en afgeleide schriften), Chinees, Koreaans en Arabisch;
- De voorgestelde omzetting wordt toegepast op de geslachtnaam, zoals deze na diakrietentransformatie (in brede zin) is ontstaan.
De opgegeven voorvoegsels en geslachtsnaam worden van diakrieten ontdaan en samen gevoegd om deze te vergelijken met de velden voorvoegsels en geslachtsnaam uit de registratie, die een zelfde bewerking hebben ondergaan.
Wegingsfactor
De wegingsfactor van een veld bepaalt de volgorde van het toepassen van het "aankleedregime": de bepaling welke aanvullende zoekcriteria worden meegenomen om tot een zoekresultaat te komen. Daarnaast wordt de wegingsfactor gebruikt om ten behoeve van de Presentievraag de score te berekenen. De hier opgegeven wegingsfactoren vormen de huidige instelling van het intelligent zoeken. Deze kunnen naar aanleiding van het afstellen van het intelligent zoeken gewijzigd worden.
Veld / Wegingsfactor
Voornamen 0,70
Voorvoegsels geslachtsnaam 0,65
Geslachtsnaam 0,85
Geboortedatum 0,90
Geboorteplaats 0,67
Geboorteland 0,60
Geslachtsaanduiding 0,90
Nationaliteit 0,30
Gemeente van inschrijving 0,50
Straatnaam 0,45
Huisnummer 0,75
Huisletter 0,40
Huisnummertoevoeging 0,25
Aanduiding bij huisnummer 0,20
Postcode 0,80
Locatiebeschrijving 0,10
Land vanwaar ingeschreven 0,32
Datum vertrek uit Nederland 0,35
Leverancier
Link naar broncode
Soortgelijke algoritmebeschrijvingen
- Algoritme dat het mogelijk maakt om fonetisch (gegevens schrijven zoals ze klinken) te zoeken op persoonsgegevens van vreemdelingen die geregistreerd zijn in de Basisvoorziening Vreemdelingen (BVV).Laatst gewijzigd op 21 december 2023 om 15:38 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Dit algoritme controleert of de gegevens die in een persoonslijst staan voldoen aan de vereisten van het Logisch Ontwerp BRP voor wat betreft de structuur en de inhoud van de gegevens (Structuur en Domeincontroles).Laatst gewijzigd op 13 januari 2025 om 9:04 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Het zoekalgoritme dat gehanteerd wordt door het BRP-Koppelpunt om te bepalen of een persoon die inlogt met een eIDAS-middel al voorkomt in de Basisregistratie Personen (BRP).Laatst gewijzigd op 15 oktober 2024 om 8:31 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- DPIA
- Status
- In gebruik
- Dit algoritme ondersteunt BRP-medewerkers bij het voorkomen van "look-alike-fraude" door het gezicht van de persoon aan de balie te vergelijken met de afbeelding in het gescande identiteitsdocument.Laatst gewijzigd op 3 december 2024 om 7:30 | Publicatiestandaard 1.0
- Publicatiecategorie
- Impactvolle algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Dit algoritme gebruiken wij ter ondersteuning bij het beslissen op uitkeringsaanvragen, het registreren van de uitkomsten en het produceren van documenten.Laatst gewijzigd op 25 juni 2024 om 14:35 | Publicatiestandaard 1.0
- Publicatiecategorie
- Impactvolle algoritmes
- Impacttoetsen
- DPIA
- Status
- In gebruik