形態学を活用した歴史的書体の計量分析
Leveraging Morphology for Historical Script Metrological Analysis
June 8, 2026
著者: Malamatenia Vlachou Efstathiou, Raphaël Baena, Dominique Stutzmann, Mathieu Aubry
cs.AI
要旨
手書き文字認識の進歩により、歴史文書の大規模な転写が可能になったが、歴史的筆跡学(パレオグラフィ)における解釈可能な視覚的測定へのアクセスは依然として限られている。本論文の主な知見は、形態学的筆跡分析、特に行レベルでの転写から文字のプロトタイプを学習する能力が、拡張可能で有意義かつ安定した古筆学的測定の定義を可能にするという点である。より正確には、トランスフォーマーベースの検出アーキテクチャとプロトタイプベースの行再構成モジュールを活用して、プロトタイプ文字とその出現、変形、位置決めを学習する。
私たちの貢献は2つある。第一に、行レベルの転写教師信号のみで効率的な文字モデリングを可能にする深層アーキテクチャと学習手法を導入し、Learnable Typewriterベースラインを大幅に改善し、正確な文字バウンディングボックス予測を実現し、古筆学的測定への可能性を開く。第二に、本アーキテクチャによって可能になった文字、バイグラム、およびグラフィカル単位間のスペースの自動測定の古筆学的関連性を紹介し、実証する。この実証のために、14世紀後半にシャルル5世が委託し、4人の写字生によって筆写された写本 Paris, BnF, fr. 2813 の注釈を160ページに拡張する。
これらのページにわたって測定結果を可視化し、グラフィカルプロファイルの識別だけでなく、微妙な変異の発見と分析を可能にすることを示す。このケーススタディは、本アプローチの拡張性と、必要なトレーニングデータの少なさを示している。なぜなら、160ページのそれぞれについて測定を計算するには、1列のテキストで十分だからである。
データとコードは以下のURLで公開されている: https://malamatenia.github.io/morphology4metrology-analysis
English
Advances in handwritten text recognition have enabled large-scale transcription of historical documents, but still provide limited access to interpretable visual measurements for paleography, the study of historical scripts. In this paper, our main insight is that morphological script analysis, in particular the capacity to learn character prototypes from line-level transcriptions, enables the definition of scalable, meaningful, and stable paleographic measurements. More precisely, we leverage a transformer-based detection architecture together with a prototype-based line reconstruction module to learn prototypical characters and their occurrence, deformation, and positioning.
Our contributions are twofold. First, we introduce a deep architecture and learning methodology that enables efficient character modeling with only line-level transcription supervision, significantly improving over the Learnable Typewriter baseline and enabling accurate character bounding box prediction, unlocking its potential for paleographic measurements. Second, we introduce and demonstrate the paleographical relevance of automatic measurements enabled by our architecture for characters, bi-grams, and spaces between graphical units. For this demonstration, we extend the annotations of the codex Paris, BnF, fr. 2813, commissioned in the late fourteenth century by Charles V and copied by four hands, to 160 pages. We visualize our measurements over these pages, showing how they enable us not only to differentiate graphical profiles, but also to discover and analyze subtle variations. This case study outlines the scalability of our approach and its frugality in terms of required training data, since a single column of text is sufficient to compute our measurements on each of the 160 pages.
Data and code are publicly available at: https://malamatenia.github.io/morphology4metrology-analysis.