Nya ögon på Sveriges medeltida skrivare

Medeltida texter möter modern datavetenskap

I projektet "Nya ögon på Sveriges medeltida skrivare" möts flera hundra år gamla handskrivna urkunder och modern datavetenskap i form av digital bildanalys, maskininlärning och datorlingvistik. Den moderna tekniken används för att analysera och kartlägga skrivarnas skrift, dvs. hur de utformade sina skrivtecken, medan metoder från datorlingvistiken används för att analysera den språkliga utformningen hos den text de producerade.

Om materialet
Materialet som analyseras är handskrivet material från det medeltida Sverige, dels s.k. diplom (medeltida brev), dels handskrifter (medeltida böcker). I de språkliga undersökningarna ligger fokus på svenskspråkigt material, men i de undersökningar som rör skriftens utformning används både svenskt och latinskt material.

Till stor del faller det undersökta materialet inom den senare delen av medeltiden, dvs. slutet av 1300-talet och hela 1400-talet. Den skrift som förekommer då i Sverige, liksom i övriga Europa, tillhör den gotiska skrifttypen, och främst de kursiva varianterna Cursiva Antiquor och Cursiva Recentior. Den senare delen av medeltiden var också en tid av mycket kraftig förändring av det svenska språkets struktur, på samtliga språkliga nivåer. Det svenska språket får sitt grundläggande uttal (förändring av stavelsestrukturen; vokaldansen), det gamla fyrkasussystemet börjar försvinna (en brytpunkt, åtminstone i stockholmsområdet runt 1450) och språket tar in en mycket stor mängd lånord från lågtyskan.

Frågor som ställs är:

  • Vilka egenskaper hos skrivtecknen är unika för en enskild individ jämfört med andra?
  • Hur förändrar sig en enskild skrivares skrift över tid?
  • Hur ser den språkliga variationen ut hos en enskild individ vid denna tid?

Tanken är att de metoder som utvecklas inom projektet också ska kunna användas på annat handskrivet material, från andra tider och med annan proveniens.

Projektet finansieras av Riksbankens jubileumsfond (NHS14-2068:1) och är en del av ett större samarbete mellan Institutionen nordiska språk, Institutionen för lingvistik och filologi (datorlingvistik) och Institutionen för informationsteologi (bildanalys) vid Uppsala universitet, som kallas From Quill to Bytes (Q2B).

Läs mer om samarbetet From Quill to Bytes


Projektbeskrivning
Ladda ned projektbeskrivning

Publikationer
Ett urval publikationer från projektet ges nedan (i omvänd kronologisk ordning):

In Search of the Scribe: Letter Spotting as a Tool for Identifying Scribes in Large Handwritten Text Corpora. Mårtensson, L. Vats, A. Hast, A. Fornés. Human IT, Vol. 14, No. 2. 2019. 

Radial Line Fourier descriptor for historical handwritten text representation.
A. Hast, E. Vats. Journal of WSCG, ISSN 1213-6972, Vol. 26, No. 1, Journal. pp. 31-40. 2018. 

Making Large Collections of Handwritten Material Easily Accessible and Searchable
A. Hast, P. Cullhed, E. Vats, M. Abrate. Proceedings of the Italian Research Conference on Digital Libraries (IRCDL), Full Paper. 2019.

Finding Logo and Seal in Historical Document Images - An Object Detection based Approach Sukalpa Chanda, Prashant Kumar Prasad, Anders Hast, Anders Brun, Lasse Martensson and Umapada Pal. The 5th Asian Conference on Pattern Recognition (ACPR 2019). 26-29 November 2019, Auckland, New Zealand.

Learning Surrogate Models of Document Image Quality Metrics for Automated Document Image Processing. P. Singh, E. Vats, A. Hast. 13th IAPR International Workshop on Document Analysis Systems (DAS), Full Paper. pp. 1-6. 2018.

TexT - Text Extractor Tool for Handwritten Document Transcription and Annotation.
A. Hast, P. Cullhed, E. Vats. 14:th Italian Research Conference on Digital Libraries, IRCDL, Full Paper.. 2018.

Automatic Document Image Binarization using Bayesian Optimization. E. Vats, A. Hast, P. Singh. The 4th International Workshop on Historical Document Imaging and Processing (HIP 2017), in conjunction with ICDAR 2017, Full Paper. 2017.

On-the-fly Historical Handwritten Text Annotation. E. Vats, A. Hast. 1st International Workshop on Human-Document Interaction (HDI 2017), in conjunction with ICDAR 2017, Full Paper. 2017. 

Automatic Scribe Attribution for Medieval Manuscripts. M. Dahllöf. Digital Medievalist 11(1): 6. 2018.

Clustering Writing Components from Medieval Manuscripts. M. Dahllöf. I: Michael Piotrowski (red.) COMHUM 2018: Book of Abstracts for the Workshop on Computational Methods in the Humanities 2018, Lausanne. 11-13. 2018.

Dahllöf, Mats. 2019. “Clustering writing components from medieval manuscripts.” I Michael Piotrowski (red.) Proceedings of the Workshop on Computational Methods in the Humanities 2018, 23-32.

Paleografiska egenskaper ur ett digitalt perspektiv. L. Mårtensson, F. Wahlberg, A. Brun. Selskab for østnordisk filologi 2. Universitets-Jubilæets danske Samfund, University Press of Southern Denmark. 2017.

Large scale continuous dating of medieval scribes using a combined image and language model. Med Fredrik Wahlberg och Anders Brun. I: Proceedings of the 12th IAPR Workshop on Document Analysis Systems (DAS 2016).

Digital Palaeography and the Old Swedish Script. The Quill Feature Method as a Tool for Scribal Attribution. Med Fredrik Wahlberg and Anders Brun. I: Arkiv för nordisk filologi 130/2015.

Large Scale Style Based Dating of Medieval Manuscripts. F. Wahlberg, L. Mårtensson, A. Brun. I: Proceedings of the 3rd International Workshop on Historical Document Imaging and Processing (HIP’15).

Scribal Attribution using a Novel 3-D Quill-Curvature Feature Histogram. F. Wahlberg, L. Mårtensson, A. Brun. I: Proceedings of the 14th International Conference on Frontiers in Handwriting Recognition (ICFHR-2014).

Data Mining Medieval Documents by Word Spotting. F. Wahlberg, M. Dahllöf, L. Mårtensson, A. Brun.  I: Proceedings of the 2011 Workshop on Historical Document Imaging and Processing.