Automatiserad handskriftstolkning (HTR)

Nu tillgängliggörs arkivmaterial inom Riksarkivet med hjälp av tekniker för automatiserad handskriftstolkning, även kallat Handwritten Text Recognition (HTR).

Från och med 2022 pågår projektet "Transkriberingsnod Sverige: maskintolkning och medborgarforskning kombinerade". Projektet är ett samarbete Riksarkivet och Göteborgs universitet – Arenor för samverkan via medborgarforskning (ARCS) med finansiering från Riksantikvarieämbetet. Med hjälp av Sveriges Släktforskarförbund har volontärer engagerats för att transkribera och skapa ny HTR-modeller. Tack vare deras arbete kommer fler arkivmaterial under 2022/23 att tillgängliggöras som fulltext.

Uppdateringar

2022-12-20: HTR-lästa dokument från Göteborgs poliskammare finns nu som öppna data under Riksarkivets sida för nedladdningsbara datamängder

2022-02-28: Göteborgs poliskammares rapportböcker för 1872 och 1885 samt inkommande och utgående telegram 1883–1885 är nu sökbara.

2021-12-13: Göteborgs poliskammares rapportbok för 1868 samt inkommande och utgående telegram 1885–1888 är nu sökbara.

2021-11-22: Rapportbok för 1890 samt inkommande och utgående telegram från Göteborgs poliskammare 1893–1897 är nu sökbara.

2021-09-07: Ytterligare en rapportbok (1869) samt inkommande och utgående telegram från Göteborgs poliskammare 1880–1882 är nu sökbara.

2021-06-23: Ytterligare två rapportböcker (1893 och 1895) från Göteborgs poliskammare är nu sökbara.

2021-01-28: Första version av fulltextsök (demo) uppe. Så här långt ingår 6 volymer med fulltexter.

Fulltextsök

Söksidan (demo) finns på: https://transkribus.eu/r/archives-sweden/

Arkiv som ingår

Hitintills är delar från två arkivmaterial sökbara:

Göteborgs Poliskammare: Detektiva avdelningens rapportböcker 1868–1902

Göteborgs poliskammares detektiva avdelning inrättades på 1850-talet och hade till uppgift att genomföra utredningar som ouniformerade poliser. Från och med 1868 fick avdelningen en fast personalgrupp och då började man föra så kallade "Rapportböcker" som innehåller kopior av alla utgående rapporter från avdelningen. Rapportböckerna från 1868 till 1902 samt inkommande och utgående telegram till avdelningen 1865–1903 kommer här bli sökbara i fritext med hjälp av automatiserad handskriftstolkning och medborgarforskning. För närvarande är göteborgsdetektivernas rapportböcker från 1868, 1869, 1872, 1880, 1885, 1888, 1890, 1892, 1893, 1895 och 1896, fattigvårdsrapporter 1893–1900, samt inkommande och utgående telegram 1880–1888 och 1893–1897 sökbara. Under våren 2022 kommer resten av sviten att bli tillgänglig i sökgränssnittet.

I ett medborgarforskningsprojekt har kunniga deltagare från allmänheten transkriberat rapporter för att skapa träningsdata för den automatiska tolkningen, samt korrekturläst och rättat de automatiskt tolkade polisrapporterna. Arbetet med rapportböckerna finansieras av och genomförs i samverkan med GPS400: Centrum för samverkande visuell forskning vid Göteborgs universitet.

Lantmäteristyrelsen, Renovationsarkivet: Geometriska jordeböcker

Denna serie av kartböcker avser de 1600-talets storskaliga kartor över Sveriges byar och gårdar. Hela samlingen om ca 15 000 kartor har tidigare digitiserats och transkriberats inom ramen för projekten Äldre och Yngre geometriska kartor vid Riksarkivet, finansierade Kungl. Vitterhetsakademien och Riksbankens Jubileumsfond. Hela samlingen, som också inkluderar kartor från andra arkiv än Lantmäteristyrelsen, finns att tillgå här: https://riksarkivet.se/visa-kartsamlingar.

HTR på Riksarkivet

HTR är en pågående aktivitet inom Riksarkivets forsknings- och utvecklingsarbete. Grunden lades i ett projekt 2020–2021 i samarbete med READ-COOP SCE med finansiering från Vinnova. Läs mer om projektet på: https://riksarkivet.se/htr.

Intresserad av att veta mer? Kontakta oss:

Olof Karsvall, e-mail: olof.karsvall[snabel-a]riksarkivet.se
Karl-Magnus Johansson, e-mail: karl-magnus.Johansson[snabel-a]riksarkivet.se