Tink derom: De algoritmebeskriuwingen yn it Frysk binne automatysk oerset. Hjir kinne flaters yn sitte. Foar de orizjinele beskriuwingen geane jo nei de Nederlânske ferzje fan it Algoritmeregister.
Anonymisearje
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk
Algemene ynformaasje
Tema
Begjindatum
Kontaktgegevens
Ferantwurde gebrûk
Doel en impact
De anonymisaasjesoftware wurdt brûkt om dokuminten dy't troch Wetterskip Fryslân publisearre binne rapper en effektiver te anonymisearjen. Dit foarkomt datalekken en draacht by oan in bettere beskerming fan de AVG-rjochten fan betrokkenen.
Afwagings
It Wetterskip fan 'e Friese Wettersteat wurdt hieltyd faker ferplichte om ynformaasje iepenbier te meitsjen. Dêrom moat privacy- of bedriuwsgefoelige ynformaasje redigearre wurde. Foardat it algoritme ynset waard, wie dizze redigearring net altyd suksesfol. Datalekken kamen foar wêrby't net alle persoanlike gegevens redigearre waarden, of wêrby't redigearre ynformaasje noch lêsber wie. It foardiel fan 'e anonymisaasjesoftware is dat it anonymisaasje rapper en effektiver útfiert. It neidiel is dat de tekstlaach fan it dokumint analysearre wurdt troch in Microsoft Azure-tsjinner. De ynhâld wurdt net op dizze tsjinner opslein, wat betsjut dat it privacyrisiko fan it brûken fan it algoritme net opweegt tsjin it privacyfoardiel fan it ferminderjen fan it oantal datalekken fanwegen ferkearde anonymisaasje.
Minskele tuskenkomst
De útfier fan it algoritme wurdt kontrolearre troch in minske. De software fereasket dat de minske alle siden kontrolearret. De minske bepaalt oft it dokumint korrekt anonymisearre is.
Risikobehear
Der is gjin risiko fan automatisearre beslútfoarming, en it algoritme hat gjin ynfloed op fûnemintele rjochten, om't it gjin besluten nimt mei juridyske gefolgen. It suggerearret allinich it anonymisearjen fan persoanlike gegevens. It algoritme wurdt ek brûkt troch de ûntwikkelder sels, wêrtroch flaters fluch identifisearre wurde kinne. Fierder wurdt it algoritme periodyk traind. Op fersyk fan ús organisaasje wurde ús dokuminten net brûkt om it algoritme te trainen. As it algoritme net goed genôch presteart, kinne wy oanpassingen meitsje mei swarte listen en wite listen. In meiwurker fan Wetterskip Fryslân docht altyd de lêste kontrôle om te soargjen dat in dokumint korrekt anonymisearre is. Der is in risiko dat meiwurkers net goed kontrolearje; wy ferminderje dit troch it belang te beklamjen fan it soarchfâldich kontrolearjen fan de persoanlike gegevens dy't troch it algoritme fûn binne. It lêste oerbleaune risiko is it privacyrisiko dat ferbûn is mei it brûken fan Azure. Dit komt om't Microsoft miskien ferplichte is om gegevens dy't it ferwurket oer te dragen oan Amerikaanske autoriteiten ûnder de Patriot Act. Om dizze risiko's te ferminderjen, hat de leveransier standert privacy ymplementearre. Tekst dy't troch de API ferstjoerd wurdt yn syngroane of asynchrone oprop nei de Azure-tsjinst kin tydlik troch Azure opslein wurde foar debuggen. De leveransier hat dizze opsje lykwols útskeakele. Dit beheint it risiko. Direkt nei ferwurking troch Azure wurde de gegevens en de gegevensferwurking wiske. Fierder is de leveransier ISO 27001-sertifisearre. De risiko's weagje net op tsjin de privacyfoardielen en it risiko fan ûnfoldwaande anonymisaasje troch it net brûken fan dizze software.
Wettlike basis
1. WOO 2. WDO 3. UAVG 4. WEP 5. WDO
Links nei wettlike basis
- Woo: https://wetten.overheid.nl/BWBR0045754/
- WDO: https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:31995L0046
- UAVG: https://wetten.overheid.nl/BWBR0040940
- Wep: https://wetten.overheid.nl/BWBR0043961
- Wdo: https://wetten.overheid.nl/BWBR0048156
Wurking
Gegevens
Alle ynformaasje dy't fûn wurdt yn 'e opladen dokuminten (útsein metadata) wurdt ferwurke troch it algoritme. Dit kin gewoane persoanlike gegevens, spesjale persoanlike gegevens en strafrjochtlike gegevens omfetsje. It kin ek kommersjeel gefoelige ynformaasje omfetsje.
Technyske wurking
Dokuminten wurde troch in meiwurker nei de applikaasje uploaden. Op dat stuit wurdt in kopy fan it orizjineel makke yn 'e foarm fan in PDF mei in tekstlaach, en de metadata fan it orizjinele dokumint wurdt fan 'e kopy fuorthelle. Dizze kopy wurdt opslein op in Nederlânske server en bliuwt dêr maksimaal 30 dagen. De tekstlaach fan 'e PDF wurdt fia in API oan it masinelearalgoritme levere. Dit is in Natuerlike Taalferwurkingsalgoritme (neamd entiteitsherkenning) fan Microsoft Azure. De API jout de lokaasje yn 'e analysearre tekst werom wêr't persoanlike gegevens wierskynlik ferskine sille, tegearre mei de kânsskoare (in persintaazje). Op dat stuit wurdt de tekstlaach fuortendaliks út Azure fuorthelle. De kânsskoare wurdt brûkt yn kombinaasje mei eigen AI-modellen ûntwikkele troch de leveransier om de meast krekte herkenning fan persoanlike gegevens te berikken. De modellen wurde traind mei help fan datasets lykas CoNLL-2003, UD Dutch LassySmall v2.8, Dutch NER Annotations for UD LassySmall, en UD Dutch Alpino v2.8. Minimale kaaiwurden foar de krektens fan it identifisearjen fan persoanlike gegevens binne as folget: Benoemde entiteiten (presyzje): 0.78, Benoemde entiteiten (weromhelje): 0.76, Benoemde entiteiten (F-skoare): 0.77. Uteinlik kontrolearret in meiwurker it dokumint, en as it dokumint finalisearre is, wurde de gegevens dy't anonymisearre wurde moatte permanint fuorthelle fan 'e tekstlaach en wurdt in swarte balke tafoege.
Leveransier
Soartgelikense algoritme beskriuwingen
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en makket it swart. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 29 april 2025 om 13:39 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en makket it swart. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 12 maaie 2025 om 10:44 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreket persoanlike gegevens yn dokuminten. In meiwurker moat alle siden kontrolearje en ferifiearje dat it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en makket it swart. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 20 maaie 2025 om 10:07 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA, ...
- Status
- Yn gebrûk
- It algoritme ûnderstreeket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 5 juny 2025 om 9:29 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- DPIA
- Status
- Yn gebrûk
- It algoritme ûnderstreeket de persoanlike gegevens yn dokuminten. In meiwurker moat alle siden besjen en kontrolearje oft it dokumint goed anonymisearre is. De software ferwideret dan alle markearre ynformaasje en swart it út. De dokuminten kinne dan publisearre wurde, bygelyks op basis fan 'e Open Government Act (WOO).Lêst feroare op 11 juny 2025 om 12:27 | Publikaasjestandaard 1.0
- Publicatiecategorie
- Oare algoritmes
- Impacttoetsen
- Fjild net ynfierd.
- Status
- Yn gebrûk