Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.

Deduplikaasjeskript

It deduplikaasjeskript helpt sykspesjalisten dûbele bestannen yn in Woo-oanfraach út te filterjen.
Lêst feroare op 24 novimber 2025 om 8:56 | Publikaasjestandaard 1.0
Publicatiecategorie
Oare algoritmes
Impacttoetsen
Fjild net ynfierd.
Status
Yn gebrûk

Algemene ynformaasje

Tema

Organisaasje en bedriuwsfiering

Begjindatum

07-2023

Kontaktgegevens

cdo@minfin.nl

Ferantwurde gebrûk

Doel en impact

It algoritme hat as doel it oanfraachproses fan 'e Open Government Act (Woo) rapper en effisjinter te meitsjen. Mei in Woo-oanfraach kinne meardere ferzjes fan 'e oanfrege dokuminten bestean. Dit algoritme helpt duplikaten fan dizze dokuminten te ferwiderjen, wêrtroch't Woo-oanfregers allinich relevante ferzjes ûntfange. Foardat it algoritme ymplementearre waard, waard dit proses mei de hân útfierd. It algoritme hat it proses fersneld, wat betsjut dat Woo-oanfregers rapper in antwurd op har oanfraach krije.

Afwagings

It algoritme helpt in sykmasjine dûbele dokuminten te finen, wêrtroch't hânmjittige kontrôle net nedich is. In mooglik neidiel is dat guon dokuminten ferkeard as "duplikaat" markearre wurde kinne. Dit bart lykwols sa min mooglik troch soarchfâldige konfiguraasje. De sykmasjine kontrolearret de resultaten altyd mei de hân.

Minskele tuskenkomst

Der binne ferskate gefallen wêrby't in spesjalist dokuminten manuell kontrolearret tidens it proses fan it deduplisearjen dêrfan. Earst docht it algoritme in suggestje, dy't de sykspesjalist evaluearret. De sykspesjalist beslút dan oft de seleksje nei de passende beliedsamtner stjoerd wurde moat. De beliedsamtner bepaalt úteinlik hokker dokuminten wichtich binne foar it Woo-fersyk en oft der dokuminten ûntbrekke.


Risikobehear

It risiko om ferkeard as duplikaat markearre te wurden is relatyf leech. Dit risiko is minimalisearre troch de folgjende maatregels:


Algoritme-ôfstimming: It algoritme is konservatyf ôfstimd. Dit betsjut dat it algoritme wierskynliker te min dokuminten as duplikaten markearret as tefolle.


Manuele resinsje: De sykmasjinist kontrolearret de resultaten fan it algoritme manuell. De resultaten wurde trochstjoerd nei de relevante beliedsamtner. De beliedsamtner beoardielet se op folsleinens en relevânsje.

Wettlike basis

Wet op Iepenbiere Oerheid

Links nei wettlike basis

Woo: https://wetten.overheid.nl/BWBR0045754/2023-04-01

Taljochting op impacttoetsen

It algoritme ferwurket gjin persoanlike gegevens. De parameters binne allinich basearre op bestânsmetadata.

Wurking

Gegevens

It algoritme brûkt de folgjende gegevens:


  • Bestânsnamme
  • Grutte fan it bestân

Technyske wurking

De ynfier komt fan it sykprogramma Zoek & Vind (Sykje & Fyn - Ministearje fan Finânsjes (overheid.nl)) fan it Ministearje fan Finânsjes. Dit programma foeget ekstra tekens ta om unike bestânsnammen te meitsjen, lykas fereaske troch Windows. It deduplikaasjeskript ûndersiket de bestânsnamme sûnder dizze ekstra tekens om te kontrolearjen op dûbele bestannen. As dûbele bestannen fûn wurde, wurde har bestânsgruttes fergelike. Op basis fan bepaalde ynstellings ferpleatst it algoritme ien fan 'e twa bestannen nei in oare map. Dit lit de sykspesjalist oer mei in map mei dokuminten dy't it deduplikaasjeskript as "net-duplikaat" beskôge hat.

Soartgelikense algoritme beskriuwingen

  • Dit is in skript dat siket nei gegevens op in spesifyk stik lân en dêrnei ynspeksje sertifikaten oanmakket. Dizze brieven wurde opslein yn in dokumintbehearsysteem.
    Lêst feroare op 21 juny 2024 om 10:28 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Ympaktfolle algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • Dit algoritme helpt by it beoardieljen fan WBSO-applikaasjes. It selekteart oanfragen mei in lyts finansjeel risiko, dy't dan flugger ferwurke wurde kinne troch RVO-meiwurkers.
    Lêst feroare op 20 febrewaris 2025 om 10:42 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    DPIA
    Status
    Yn gebrûk
  • It algoritme 'Begjin fan bûtenlânske bedriuwen foar leanbelesting helpt meiwurkers fan belestingautoriteiten om de krekte en folsleine ynhâld en betelling fan leanbelesting foar bûtenlânske bedriuwen te kontrolearjen. It algoritme helpt meiwurkers fan Belestingtsjinsten te reagearjen op mooglik ferkearde rendeminten.
    Lêst feroare op 29 jannewaris 2025 om 9:31 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Ympaktfolle algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • Dit algoritme helpt meiwurkers dokuminten te beoardieljen. Se kinne dokuminten sykje, groepearje en duplikaten fine. Hjirmei kinne resinsinten fluch sjen oft dielen fan dokuminten wichtich binne en oft de ynformaasje iepenbier makke wurde moat.
    Lêst feroare op 4 juny 2026 om 14:00 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk
  • Dit algoritme helpt meiwurkers dokuminten te beoardieljen. Se kinne dokuminten sykje, groepearje en duplikaten fine. Hjirmei kinne resinsinten fluch sjen oft dielen fan dokuminten wichtich binne en oft de ynformaasje iepenbier makke wurde moat.
    Lêst feroare op 4 juny 2026 om 13:59 | Publikaasjestandaard 1.0
    Publicatiecategorie
    Oare algoritmes
    Impacttoetsen
    Fjild net ynfierd.
    Status
    Yn gebrûk