NACE SBI Classifier

Het omzetten van de in het handelsregister opgenomen SBI codes van het CBS van de 2008 standaard naar 2025 standaard

Laatst gewijzigd op 21 maart 2025 om 9:28 | Publicatiestandaard 1.0
Publicatiecategorie
Impactvolle algoritmes
Impacttoetsen
DPIA, ...
Status
In ontwikkeling

Algemene informatie

Thema

Organisatie en bedrijfsvoering

Begindatum

2025-01

Einddatum

2025-12

Contactgegevens

algoritme@kvk.nl

Link naar publiekspagina

https://www.kvk.nl/over-het-handelsregister/overzicht-standaard-bedrijfsindeling-sbi-codes-voor-activiteiten/

Link naar bronregistratie

niet openbaar

Verantwoord gebruik

Doel en impact

In 2025 zal er een grote herziening zijn in de Standaard Bedrijfsindeling (SBI) opgelegd vanuit Eurostat, het Europees statistiek bureau. Iedere organisatie krijgt één of meerdere SBI-codes bij inschrijving in het handelsregister, of wanneer wijzigingen aan activiteiten plaatsvinden.


De NACE 2025 herziening gebeurt op basis van de 2008 indeling. Deze herziening betekent dat KVK in september 2025 alle bestaande 5,6 miljoen SBI codes aangepast gaan worden op in totaal 3,75 miljoen inschrijvingen:


  • 4,6 miljoen "mutaties" waar de nieuwe code gelijk is aan de oude code (met soms een extra cijfer of letter) of 2 bestaande SBI codes overgaan in 1 SBI code
  • 1 miljoen "typeringen" waarbij 1 oude code opgeplitst zal worden in 2 of meer nieuwe codes


De NACE SBI Classifier ondersteunt via meerdere deelprocessen bij deze herziening.


  • De eerste stap is het verwijderen van naar personen herleidbare gegevens binnen het KVK netwerk, die in vervolgstappen, mogelijk tot bevooroordeling of misbruik kunnen leiden.
  • In de volgende stap zal door middel van een LLM (ChatGPT 4o), op basis van een combinatie van inputs (prompt), een voorstel voor nieuwe SBI-code volgens 2025 standaard voor ingeschreven ondernemingen worden gegenereerd. Hierbij wordt de schakeltabel van CBS gebruikt en toelichtingen van SBI-codering van CBS.
  • Uitkomsten van beide stappen worden steeksproefsgewijs handmatig geverifieerd én handmatig gecorrigeerd door medewerkers, de 2de stap aan de hand van een door LLM gegenereerde motivatie.


Na herziening is de SBI-code zelf nog aan te passen door ondernemers via bestaande kanalen (Online Wijzigen/Mijn KVK). De ondernemer wordt hier via verschillende kanalen over geinformeerd.

Afwegingen

  • Actoren: Ingeschreven ondernemers, KVK medewerkers
  • Belangen: Voor de ondernemers geldt dat hun belangen beter gediend zijn met deze oplossing doordat de omzetting effectiever uitgevoerd kan worden en hij/zij beter geholpen wordt bij het afnemen van verplichte dienstverlening via bestaande kanalen. De belangen en de kaders van de twee groepen liggen vast in de Handelsregisterwet. Deze toepassing raakt daarnaast ook de belangen van de KVK medewerkers, in de zin dat het alternatief van het handmatig typeren van meer dan een miljoen SBI codes, het uitvoeren van de andere opgaven vastgelegd in de handelsregisterwet zou belemmeren.

Menselijke tussenkomst

  • Ondernemer heeft onderneming ingeschreven of gewijzigd volgens bestaande methodiek met tussenkomst van Front Office medewerker of Back Office medewerker
  • Het model wordt getraind en getest op basis van input door kwaliteitsmedewerkers, voor toepassing op productiedata.
  • Herzieningsvoorstellen op productiedata op basis van algoritmes worden steeksproefsgewijst geverifieerd door medewerkers.
  • Ondernemer kan na herziening inschrijving/registratie wijzigen met controle achteraf door Backoffice-medewerker

Risicobeheer

Risico is geminimaliseerd op verwerking van persoonsgegevens, door toepassenm vam anonimisering (verwijderen van naar personen herleidbare gegevens) tbv het "AI proces".


DPIA checklist is doorlopen, daaruit is gekomen dat we geen DPIA hoeven op te stellen. In de checklist wordt verwezen naar het Cloud-, AVG- en AI en algoritmebeleid van KVK.



Wettelijke basis

  • Artikel 19 Handelsregisterwet 2007
  • Artikel 13 Handelsregisterwet 2007: 

Links naar wettelijke basis

  • Artikel 19 Handelsregisterwet 2007: https://wetten.overheid.nl/BWBR0021777/2024-06-19/#Hoofdstuk3
  • Artikel 13 Handelsregisterwet 2007: https://wetten.overheid.nl/BWBR0021777/2024-06-19/#Hoofdstuk2

Link naar verwerkingsregister

nvt, we verwerken geen persoonsgegevens

Toelichting op impacttoetsen

  • DPIA = Data Protection Impact Analyse
  • BIA = Business Impact Analyse
  • De BIV score bij de BIA gaat over Beschikbaarheid, Integriteit en Veiligheid. Hierbij is 1 het laagst en 3 het hoogst.
  • TIjdens de impacttoetsen is er gekeken naar: Intern AI beleid op basis van EU AI Act, Intern Cloud beleid op basis van Rijksbreed Cloudbeleid 2022, Intern Privacy Beleid op basis van Algemene Verordening Gegevensbescherming (AVG)


Impacttoetsen

  • DPIA checklist: Prescan van DPIA gedaan, daar is uitgekomen dat er geen DPIA benodigd is
  • BIA checklist: Prescan van BIA gedaan, daar is uitgekomen dat er geen BIA benodigd is (BIV score: 1-2-1)
  • Intern KVK AI beleid: Op basis van de EU AI Act

Werking

Gegevens

  • Zie hieronder

Links naar gegevensbronnen

  • CBS SBI codelijst: https://sbi.cbs.nl/
  • Spacy: https://www.spacy.io/
  • Handelsregister: https://www.kvk.nl/zoeken

Technische werking

  • Extract gemaakt van inschrijfgegevens van ondernemingen uit handelsregister.
  • Doorvoer door anonimiseringstool en controle.
  • Individuele ondernemingsgegevens worden bijgevoegd aan prompt met schakelschema, typeringsinformatie en activiteitsomschrijvingen.
  • ChatGPT 4o geeft suggestie voor op te voeren SBI code volgens 2025 herziening met motivering voor keuze.
  • Uitkomsten worden gevalideerd door kwaliteitsexperts voordat herziening zal worden doorgevoerd in handelsregister. 

Leverancier

Intern ontwikkeld

Link naar broncode

niet openbaar