Transcriptieplatform Transkribus
Dit algoritme heeft een laag impact. Het op woorden doorzoekbaar maken van historische handgeschreven documenten.
Laatst gewijzigd op 10 september 2025 om 14:41 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
Algemene informatie
Thema
Cultuur en recreatie
Begindatum
2022-07
Contactgegevens
algoritmen@amsterdam.nl
Verantwoord gebruik
Doel en impact
Het digitaal toegankelijk en doorzoekbaar maken van historische handgeschreven documenten voor onderzoekers en andere geïnteresseerden. Geen impact.
Afwegingen
Historisch onderzoek makkelijker maken. Hierdoor hebben meer mensen toegang tot historisch bronmateriaal.
Menselijke tussenkomst
De AI-modellen zijn binnen de tool Transkribus door medewerkers van het Stadsarchief getraind. De computergelezen teksten (HTR) zijn achteraf niet meer door mensen gecorrigeerd, waardoor er fouten kunnen zitten in de gelezen karakters
Risicobeheer
De risico’s zijn laag. Het Stadsarchief verwerkt geen niet-openbare documenten met HTR. Transkribus is voortgekomen uit een EU Horizon 2020 programma een daarna doorontwikkeld tot een Europese coöperatie met een groot aantal internationale erfgoedinstituten als leden. Alle data en metadata worden op Europese servers gehost en voldoen aan GDPR en AVG.
Werking
Gegevens
Transcripties en Ground Truth
De dataset bevat machinegelezen transcripties en Ground Truth (trainingsmateriaal) van historische handschriften uit de notariële archieven, het archief van Publieke Werken en het openbare deel van de Burgerlijke Stand. Periodiek worden nieuwe scans met HTR toegevoegd. Het trainingsmateriaal bestaat uit tienduizenden transcripties, gemaakt door vrijwilligers en medewerkers van het Stadsarchief Amsterdam.
Technische werking
Met machine learning en Handwritten Text Recognition (HTR)-technieken worden AI-modellen getraind op het herkennen van handschriften. Zowel van17e-eeuwse- als modernere handschriften.
Architectuur van het model
De HTR is uitgevoerd met verschillende specifieke en generieke AI-modellen binnen Transkribus, gebruikmakend van convolutional neural networks en transformer neural networks.
Leverancier
Transkribus
Link naar broncode
https://transkribus.eu/r/amsterdam-city-archives
Soortgelijke algoritmebeschrijvingen
- Dit algoritme heeft een laag impact. Het op woorden doorzoekbaar maken van historische handgeschreven documenten.Laatst gewijzigd op 24 juni 2024 om 7:00 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Op basis van taaltechnologie worden persoons- en bedrijfsnamen gelezen en uitgefilterd uit tekstbestanden als emails en losse documenten.Laatst gewijzigd op 5 februari 2025 om 9:14 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- DPIA
- Status
- In gebruik
- Dit algoritme helpt bij het terugvinden van informatie in cold case-dossiers. Het gebruikt een taalmodel om te zoeken op de betekenis van woorden en niet alleen op de exacte woorden.Laatst gewijzigd op 28 januari 2025 om 13:28 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- DPIA, Quickscan ethiek
- Status
- In gebruik
- Contextgevoelige zoekfunctionaliteit die op basis van een gebruikersvraag relevante en letterlijke tekstfragmenten als antwoord ophaalt en presenteert.Laatst gewijzigd op 26 mei 2025 om 12:06 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik
- Op basis van taaltechnologie worden persoons- en bedrijfsnamen gelezen en uitgefilterd uit tekstbestanden als emails en losse documenten.Laatst gewijzigd op 26 januari 2026 om 12:53 | Publicatiestandaard 1.0
- Publicatiecategorie
- Overige algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik