De afgelopen jaren zijn er in ons project Crowd Leert Computer Lezen enorm veel scans getranscribeerd. Een groot deel van deze scans zijn gebruikt in een Transkribus-model dat samen met Chronicling Novelty is gemaakt en dat nu voor alle gebruikers van Transkribus gratis beschikbaar wordt gemaakt. Een droom wordt daarmee werkelijkheid: de lastig leesbare handschriften uit de zeventiende eeuw zijn voortaan automatisch te lezen!
Het Stadsarchief Amsterdam en het Nationaal Archief hebben hun beste 18e eeuwse HTR-modellen gebundeld in een nieuw, gecombineerd model: Dutch Mountains!
De eerste resultaten van Crowd Leert Computer Lezen waren nog maar net online, toen kunsthistorica Saskia Kuus via twitter liet weten wat een goudmijn dit was voor haar onderzoek naar historische (kinder-)kleding.
In september werd al gemeld dat het Stadsarchief erin was geslaagd om een eerste algemeen model te maken voor 18e eeuwse notariële handschriften. Sindsdien is ook gewerkt een keyword-spotting (KWS) demonstrator op basis van dit model. Zowel het model als de KWS-demonstrator zijn nu voor iedereen te gebruiken.
Het zoeken door teksten met Handwritten Text Recognition (HTR) brengt allerlei nieuwe mogelijkheden met zich mee voor het zoeken naar verhalen uit de Amsterdamse geschiedenis. Van de chique bewoners van het Trippenhuis tot de arme stedelingen in de sloppen van het stadseiland Marken. Van onbekende schilderijen door Rembrandt tot de namen van slaafgemaakten tijdens de grote opstand in Berbice (1763). Een paar voorbeelden van vondsten uit de nieuwe HTR-zoekomgeving willen we hier alvast delen.
Sinds 2018 experimenteert het Stadsarchief Amsterdam met handschriftherkenning. Onlangs is het eerste 'algemene model' gemaakt waarmee achttiende-eeuwse teksten vrijwel foutloos worden getranscribeerd. De foutmarge voor deze handgeschreven teksten ligt nu tussen de 2 en 5 procent.
De afgelopen jaren zijn er in ons project Crowd Leert Computer Lezen enorm veel scans getranscribeerd. Een groot deel van deze scans zijn gebruikt in een Transkribus-model dat samen met Chronicling Novelty is gemaakt en dat nu voor alle gebruikers van Transkribus gratis beschikbaar wordt gemaakt. Een droom wordt daarmee werkelijkheid: de lastig leesbare handschriften uit de zeventiende eeuw zijn voortaan automatisch te lezen!
De eerste resultaten van Crowd Leert Computer Lezen waren nog maar net online, toen kunsthistorica Saskia Kuus via twitter liet weten wat een goudmijn dit was voor haar onderzoek naar historische (kinder-)kleding.
Het zoeken door teksten met Handwritten Text Recognition (HTR) brengt allerlei nieuwe mogelijkheden met zich mee voor het zoeken naar verhalen uit de Amsterdamse geschiedenis. Van de chique bewoners van het Trippenhuis tot de arme stedelingen in de sloppen van het stadseiland Marken. Van onbekende schilderijen door Rembrandt tot de namen van slaafgemaakten tijdens de grote opstand in Berbice (1763). Een paar voorbeelden van vondsten uit de nieuwe HTR-zoekomgeving willen we hier alvast delen.
Het Stadsarchief Amsterdam en het Nationaal Archief hebben hun beste 18e eeuwse HTR-modellen gebundeld in een nieuw, gecombineerd model: Dutch Mountains!
In september werd al gemeld dat het Stadsarchief erin was geslaagd om een eerste algemeen model te maken voor 18e eeuwse notariële handschriften. Sindsdien is ook gewerkt een keyword-spotting (KWS) demonstrator op basis van dit model. Zowel het model als de KWS-demonstrator zijn nu voor iedereen te gebruiken.
Sinds 2018 experimenteert het Stadsarchief Amsterdam met handschriftherkenning. Onlangs is het eerste 'algemene model' gemaakt waarmee achttiende-eeuwse teksten vrijwel foutloos worden getranscribeerd. De foutmarge voor deze handgeschreven teksten ligt nu tussen de 2 en 5 procent.