Kadastrale kaart next
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
Algemene informatie
Thema
- Ruimte en infrastructuur
- Werk
- Wonen
Begindatum
Contactgegevens
Verantwoord gebruik
Doel en impact
Afwegingen
Menselijke tussenkomst
Human on the loop. Dit betekent dat AI wordt toegepast in een automatisch proces. Zijn er afwijkingen? Dan controleren mensen het resultaat en passen dit aan als dat nodig is.
Risicobeheer
Wettelijke basis
Werking
Gegevens
Wij hebben een set veldwerken gebruikt, die kenmerkend is voor ons archief. Die set bestaat uit verschillende regio’s en tijdsperiodes. Dan is er nog een set voor OCR: het omzetten van handgeschreven teksten naar informatie die de computer kan lezen. Deze set bestaat uit ongeveer 200.000 veldwerken. De end-to-end set voor lijn- en objectdetectie bestaat uit 3.000 veldwerken.
Technische werking
Het algoritme gebruikt aparte neurale netwerken voor de OCR, lijndetectie en objectdetectie: * voor de OCR gebruiken we een NN, dat bestaat uit CNN- en RNN-lagen * de lijndetectie gebeurt op basis van een aangepast UNET * de objectdetectie gebeurt met een MaskRCNN op basis van de SWIN transformer architectuur Deze modellen zijn getraind op basis van veldwerk (componenten) en annotaties. Annotaties zijn notities met een opmerking of uitleg. De beschikbare dataset splitsen we op in train, validatie en test-sets. De traindata augmenteren we tijdens het trainen om een veelzijdige trainset te maken. Tijdens het trainen bepalen we na elke iteratie de F-score op de validatie-set. Zodra de performance op de validatie-set niet meer verbetert, stoppen we met het trainen. Daarna bepalen we de F-score op de test-set. Is deze F-score beter dan vorige trainingen? Dan gebruiken we de gewichten van het neurale netwerk voor de voorspellingen.