Terug naar alle algoritmes

Transcriptieplatform Transkribus

Dit algoritme heeft een laag impact. Het op woorden doorzoekbaar maken van historische handgeschreven documenten.

Organisatie
Gemeente Amsterdam
Thema
Cultuur en recreatie
Status
In gebruik

Algemene informatie

Naam

Transcriptieplatform Transkribus

Korte omschrijving

Dit algoritme heeft een laag impact. Het op woorden doorzoekbaar maken van historische handgeschreven documenten.

Organisatie

Gemeente Amsterdam

Thema

Cultuur en recreatie

Status

In gebruik

Begindatum

Veld niet ingevuld.

Contactgegevens

algoritmen@amsterdam.nl

Link naar publiekspagina

https://algoritmeregister.amsterdam.nl/ai-system/transcriptieplatform-transkribus/1103/

Publicatiecategorie

Overige algoritmes

Verantwoord gebruik

Doel en impact

Het digitaal toegankelijk en doorzoekbaar maken van historische handgeschreven documenten voor onderzoekers en andere geïnteresseerden. Geen impact.

Afwegingen

Historisch onderzoek makkelijker maken. Hierdoor hebben meer mensen toegang tot historisch bronmateriaal.

Menselijke tussenkomst

De AI-modellen zijn binnen de tool Transkribus door medewerkers van het Stadsarchief getraind. De computergelezen teksten (HTR) zijn achteraf niet meer door mensen gecorrigeerd, waardoor er fouten kunnen zitten in de gelezen karakters

Risicobeheer

De risico’s zijn laag. Het Stadsarchief verwerkt geen niet-openbare documenten met HTR. Transkribus is voortgekomen uit een EU Horizon 2020 programma een daarna doorontwikkeld tot een Europese coöperatie met een groot aantal internationale erfgoedinstituten als leden. Alle data en metadata worden op Europese servers gehost en voldoen aan GDPR en AVG. 

Werking

Gegevens

Transcripties en Ground Truth
De dataset bevat machinegelezen transcripties en Ground Truth (trainingsmateriaal) van historische handschriften uit de notariële archieven, het archief van Publieke Werken en het openbare deel van de Burgerlijke Stand. Periodiek worden nieuwe scans met HTR toegevoegd. Het trainingsmateriaal bestaat uit tienduizenden transcripties, gemaakt door vrijwilligers en medewerkers van het Stadsarchief Amsterdam.

Technische werking

Met machine learning en Handwritten Text Recognition (HTR)-technieken worden AI-modellen getraind op het herkennen van handschriften. Zowel van17e-eeuwse- als modernere handschriften.

Architectuur van het model
De HTR is uitgevoerd met verschillende specifieke en generieke AI-modellen binnen Transkribus, gebruikmakend van convolutional neural networks en transformer neural networks. 

Leverancier

Transkribus