AI-transkribering av arkivhandlingar

Igår blev jag intervjuad av en student från Göteborgs Universitet om hur vi släktforskare använder arkiven. Det var inte bara allmänna frågor utan även om hur jag ser på AI-transkribering av handskrivna texter i arkivhandlingar.
Naturligtivis är det intressant att få ge sina synpunkter som släktforskare i sådana här ämnen. Vi släktforskare är kanske de största arkivanvändarna, sett till mängden handlingar/volymer vi använder, även om mycket annan arkivforskning också pågår.

Vi talade bl a om det projekt som pågår på Göteborgs universitet som innebär att polisrapporter från 1868–1902 transkriberas med hjälp av AI. Om jag fattat rätt går det till så att dataprogrammet som gör transkriberingen tränas att läsa handskriven text, för att så småningom kunna läsa med stor tillförlitlighet.
Träningen sker med hjälp av handpåläggning, alltså manuell rättning, tills programmet lärt sig känna igen varje bokstav i dess olika variationer. Så har jag uppfattat projektet.

Tillägg 15 oktober: Här kan du söka i polishandlingarna: https://transkribus.eu/r/archives-sweden/

AI kan ju kännas lite skrämmande, men när det gäller detta kan det säkert vara till stor nytta. Den stora fördelen är att texterna blir sökbara. Får jag en träff när jag söker kan jag sedan gå till källan för att kontrollera att transkriberingen är korrekt.
Det är ju så vi släktforskare gör, eller hur? Vi går till källorna eftersom det inte går att lita på till 100 procent att en avskrift är korrekt.

Ett område som skulle vara till stor nytta att få transkriberade är domböckerna. Tänk att i en avskrift av en dombok kunna söka på gamla släktingars namn! Idag behöver jag ha ett datum att gå på för att hitta i domboken, om jag inte är beredd att läsa sida upp och sida ner.
Jag vet att det finns släktforskare som gjort så, och både gjort register och avskrifter. Heder och stort tack till er som delar med er av detta!

I domböckerna finns livet beskrivet, så som det var. Väldigt många hamnade i domboken förr, inte bara genom kriminalitet utan som vittnen eller i fastighetsaffärer eller privata tvister. Men det finns ju så oändligt många domböcker och att AI-transkribera dessa skulle väl ta en oöverskådlig tid, antar jag.

transkribering dombok

Den här domboken skulle jag gärna se transkriberad och sökbar. På de här sidorna är en av mina förfäder omskriven, vid urtima ting i Faurås häradsrätt i Halland den 16 augusti 1750. Just de här sidorna har jag redan läst eftersom jag skrivit om rättegången i min släktbok om min mammas släkt, men i den tjocka domboken på flera hundra sidor är säkert fler av mina gamlsa släktingar omnämnda. Bildkälla: Arkiv Digital.

×
Håll dig informerad

När du prenumererar på Rötterbloggen kommer vi att skicka dig ett e-post när ett nytt blogg-inlägg kommit så att du inte missar något.

Robert och Jenny Nilsson
Sveriges sista grottmänniska - och sedan
 

Kommentarer 8

Stefan Simander den lördag, 14 oktober 2023 01:12

AI, AI, kapten!
Spännande (och lite skrämmande) utveckling!

AI, AI, kapten! :p Spännande (och lite skrämmande) utveckling! :o
StorStockholms Släktforskarförening den lördag, 14 oktober 2023 23:30

I själva verket pågår nu fas 2 av projektet, som handlar just om olika domböcker och som jag är involverad i. Ett första släpp av AI-transkriberade sidor är nära förestående.

Ulf Berggren

I själva verket pågår nu fas 2 av projektet, som handlar just om olika domböcker och som jag är involverad i. Ett första släpp av AI-transkriberade sidor är nära förestående. Ulf Berggren
Eva Johansson den söndag, 15 oktober 2023 12:50

Ulf: Tack för den informationen! Det låter ju väldigt bra.

Ulf: Tack för den informationen! Det låter ju väldigt bra.
Aina Wallström den söndag, 15 oktober 2023 18:26

Jag var med och rättade de AI-transkriberade sidorna i polisrapport-böckerna (den detektiva avdelningen) som nu är sökbara på riksarkivets hemsida: https://transkribus.eu/r/archives-sweden/

Projektet har varit baserat på medborgarforskning på Riksarkivet Landsarkivet i Göteborg, och här är en föreläsning om hur det gick till: https://youtu.be/WYTnePmZylg

Jag har även sett att det finns en kurs på Göteborgs Universitet att söka som heter "Paleografi och AI. Att läsa historiska källor med hjälp av ny teknik." Det låter ju spännande!
/Aina Wallström



Jag var med och rättade de AI-transkriberade sidorna i polisrapport-böckerna (den detektiva avdelningen) som nu är sökbara på riksarkivets hemsida: https://transkribus.eu/r/archives-sweden/ Projektet har varit baserat på medborgarforskning på Riksarkivet Landsarkivet i Göteborg, och här är en föreläsning om hur det gick till: https://youtu.be/WYTnePmZylg Jag har även sett att det finns en kurs på Göteborgs Universitet att söka som heter "Paleografi och AI. Att läsa historiska källor med hjälp av ny teknik." Det låter ju spännande! /Aina Wallström
Eva Johansson den söndag, 15 oktober 2023 18:36

Aina: Tack för din kommentar och länkarna! Att det finns på Riksarkivet nu visste jag inte, men har inte letat där heller. Så bra att det är tillgängligt för alla.
Aina, din kommentar blev också en påminnelse för mig om att jag vid tillfälle ska blogga om din masteruppsats som du berättat om för mig. Den har jag inte glömt.

Aina: Tack för din kommentar och länkarna! Att det finns på Riksarkivet nu visste jag inte, men har inte letat där heller. Så bra att det är tillgängligt för alla. Aina, din kommentar blev också en påminnelse för mig om att jag vid tillfälle ska blogga om din masteruppsats som du berättat om för mig. Den har jag inte glömt.
Aina Wallström den söndag, 15 oktober 2023 19:05

Eva: Ja, just det, det pratade vi om i Gamleby. Roligt om du gör det!

Eva: Ja, just det, det pratade vi om i Gamleby. Roligt om du gör det!
Kent Nilsson den torsdag, 21 mars 2024 13:38

Ny banbrytande AI-modell för svenska historiska texter
https://riksarkivet.se/nyheter-och-press?item=120354

Ny banbrytande AI-modell för svenska historiska texter https://riksarkivet.se/nyheter-och-press?item=120354
Eva Johansson den torsdag, 21 mars 2024 14:29

Kent: Tack för tipset! Den har jag läst om men inte provat än.

Kent: Tack för tipset! Den har jag läst om men inte provat än.
Redan registrerad? Logga in här
Gäst
27 april 2024

Captcha bild