형태론을 활용한 역사적 문자 계측 분석
Leveraging Morphology for Historical Script Metrological Analysis
June 8, 2026
저자: Malamatenia Vlachou Efstathiou, Raphaël Baena, Dominique Stutzmann, Mathieu Aubry
cs.AI
초록
필기체 텍스트 인식의 발전으로 역사 문서의 대규모 전사가 가능해졌지만, 고문자학(역사 필체 연구)을 위한 해석 가능한 시각적 측정치에 대한 접근은 여전히 제한적이다. 본 논문의 주요 통찰은 형태학적 필체 분석, 특히 행 수준 전사로부터 문자 원형을 학습하는 능력이 확장 가능하고 의미 있으며 안정적인 고문자학적 측정치를 정의할 수 있게 한다는 점이다. 보다 구체적으로, 우리는 변압기 기반 검출 아키텍처와 원형 기반 행 재구성 모듈을 활용하여 원형 문자와 그 출현, 변형, 위치를 학습한다.
본 연구의 기여는 두 가지이다. 첫째, 행 수준 전사 지도만으로 효율적인 문자 모델링을 가능하게 하는 심층 아키텍처와 학습 방법론을 도입하여, Learnable Typewriter 기준선 대비 크게 개선하고 정확한 문자 경계 상자 예측을 가능하게 함으로써 고문자학적 측정을 위한 잠재력을 발휘한다. 둘째, 우리 아키텍처가 가능하게 하는 문자, 바이그램, 그래픽 단위 간 공백에 대한 자동 측정의 고문자학적 관련성을 소개하고 입증한다. 이 시연을 위해, 14세기 후반 샤를 5세가 의뢰하고 네 명의 필사자가 필사한 코덱스 파리 BnF fr. 2813의 주석을 160페이지로 확장한다. 우리는 이 페이지들에 걸친 측정치를 시각화하여, 이를 통해 그래픽 프로파일을 구분할 수 있을 뿐만 아니라 미묘한 변이를 발견하고 분석할 수 있음을 보여준다. 이 사례 연구는 우리 접근법의 확장성과 요구되는 훈련 데이터의 경제성을 보여주는데, 160페이지 각각에 대해 측정치를 계산하는 데 한 열의 텍스트만으로 충분하기 때문이다.
데이터와 코드는 다음에서 공개적으로 이용 가능하다: https://malamatenia.github.io/morphology4metrology-analysis
English
Advances in handwritten text recognition have enabled large-scale transcription of historical documents, but still provide limited access to interpretable visual measurements for paleography, the study of historical scripts. In this paper, our main insight is that morphological script analysis, in particular the capacity to learn character prototypes from line-level transcriptions, enables the definition of scalable, meaningful, and stable paleographic measurements. More precisely, we leverage a transformer-based detection architecture together with a prototype-based line reconstruction module to learn prototypical characters and their occurrence, deformation, and positioning.
Our contributions are twofold. First, we introduce a deep architecture and learning methodology that enables efficient character modeling with only line-level transcription supervision, significantly improving over the Learnable Typewriter baseline and enabling accurate character bounding box prediction, unlocking its potential for paleographic measurements. Second, we introduce and demonstrate the paleographical relevance of automatic measurements enabled by our architecture for characters, bi-grams, and spaces between graphical units. For this demonstration, we extend the annotations of the codex Paris, BnF, fr. 2813, commissioned in the late fourteenth century by Charles V and copied by four hands, to 160 pages. We visualize our measurements over these pages, showing how they enable us not only to differentiate graphical profiles, but also to discover and analyze subtle variations. This case study outlines the scalability of our approach and its frugality in terms of required training data, since a single column of text is sufficient to compute our measurements on each of the 160 pages.
Data and code are publicly available at: https://malamatenia.github.io/morphology4metrology-analysis.