文化遺産の復興:歴史的文書の包括的修復に向けた新たなアプローチ
Reviving Cultural Heritage: A Novel Approach for Comprehensive Historical Document Restoration
July 7, 2025
著者: Yuyi Zhang, Peirong Zhang, Zhenhua Yang, Pengyu Yan, Yongxin Shi, Pengwei Liu, Fengjun Guo, Lianwen Jin
cs.AI
要旨
歴史文書は貴重な文化遺産を代表するが、時間の経過とともに破損、水浸食、酸化による著しい劣化を被っている。既存の歴史文書修復(HDR)手法は、単一モダリティまたは限られたサイズの修復に主眼を置いており、実用的なニーズを満たすには至っていない。このギャップを埋めるため、本論文では全ページHDRデータセット(FPHDR)と新たな自動化HDRソリューション(AutoHDR)を提案する。具体的には、FPHDRは1,633枚の実画像と6,543枚の合成画像から構成され、文字レベルおよび行レベルの位置情報、ならびに異なる損傷度合いにおける文字アノテーションを含む。AutoHDRは、歴史家の修復ワークフローを模倣する三段階のアプローチを採用している:OCR支援による損傷箇所の特定、視覚-言語コンテキストに基づくテキスト予測、パッチ自己回帰的な外観修復である。AutoHDRのモジュール型アーキテクチャは、各修復段階での柔軟な介入と最適化を可能にし、人間と機械のシームレスな協働を実現する。実験結果は、AutoHDRがHDRにおいて卓越した性能を発揮することを示している。深刻な損傷を受けた文書を処理する際、本手法はOCR精度を46.83%から84.05%に向上させ、さらに人間と機械の協働により94.25%まで改善された。本研究は、自動化された歴史文書修復における重要な進展を表し、文化遺産の保存に大きく貢献すると確信している。モデルとデータセットはhttps://github.com/SCUT-DLVCLab/AutoHDRで公開されている。
English
Historical documents represent an invaluable cultural heritage, yet have
undergone significant degradation over time through tears, water erosion, and
oxidation. Existing Historical Document Restoration (HDR) methods primarily
focus on single modality or limited-size restoration, failing to meet practical
needs. To fill this gap, we present a full-page HDR dataset (FPHDR) and a novel
automated HDR solution (AutoHDR). Specifically, FPHDR comprises 1,633 real and
6,543 synthetic images with character-level and line-level locations, as well
as character annotations in different damage grades. AutoHDR mimics historians'
restoration workflows through a three-stage approach: OCR-assisted damage
localization, vision-language context text prediction, and patch autoregressive
appearance restoration. The modular architecture of AutoHDR enables seamless
human-machine collaboration, allowing for flexible intervention and
optimization at each restoration stage. Experiments demonstrate AutoHDR's
remarkable performance in HDR. When processing severely damaged documents, our
method improves OCR accuracy from 46.83\% to 84.05\%, with further enhancement
to 94.25\% through human-machine collaboration. We believe this work represents
a significant advancement in automated historical document restoration and
contributes substantially to cultural heritage preservation. The model and
dataset are available at https://github.com/SCUT-DLVCLab/AutoHDR.