Теоретические основы латентных апостериорных факторов: формальные гарантии для многодоказательного рассуждения

Аннотация

Мы представляем полную теоретическую характеристику Латентных Постериорных Факторов (LPF) — принципиального подхода для агрегирования множества гетерогенных элементов доказательств в задачах вероятностного прогнозирования. Рассуждения на основе множества доказательств повсеместно возникают в областях с высокими ставками, включая медицинскую диагностику, оценку финансовых рисков, анализ юридических дел и соблюдение нормативных требований, однако существующие подходы либо не имеют формальных гарантий, либо архитектурно не справляются со сценариями множественных доказательств. LPF кодирует каждый элемент доказательства в гауссово латентное апостериорное распределение с помощью вариационного автоэнкодера, преобразует апостериорные распределения в мягкие факторы посредством маргинализации методом Монте-Карло и агрегирует факторы с помощью точного вывода в Суммарно-Произвольной Сети (LPF-SPN) или обученного нейросетевого агрегатора (LPF-Learned). Мы доказываем семь формальных гарантий, охватывающих ключевые требования к достоверному ИИ: Сохранение Калибровки (ECE <= epsilon + C/sqrt(K_eff)); Спад Ошибки Монте-Карло как O(1/sqrt(M)); не тривиальную границу PAC-Байеса с разрывом обучение-тестирование 0.0085 при N=4200; работу в пределах 1.12 от информации-теоретической нижней границы; устойчивую деградацию как O(epsilon*delta*sqrt(K)) при повреждениях, сохраняя 88% производительности при замене половины доказательств противником; спад калибровки O(1/sqrt(K)) с R^2=0.849; и точное разложение эписемической-алеаторной неопределенности с ошибкой ниже 0.002%. Все теоремы эмпирически проверены на контролируемых наборах данных объемом до 4200 обучающих примеров. Наша теоретическая основа утверждает LPF в качестве фундамента для достоверного многодоказательного ИИ в критически важных для безопасности приложениях.

English

We present a complete theoretical characterization of Latent Posterior Factors (LPF), a principled framework for aggregating multiple heterogeneous evidence items in probabilistic prediction tasks. Multi-evidence reasoning arises pervasively in high-stakes domains including healthcare diagnosis, financial risk assessment, legal case analysis, and regulatory compliance, yet existing approaches either lack formal guarantees or fail to handle multi-evidence scenarios architecturally. LPF encodes each evidence item into a Gaussian latent posterior via a variational autoencoder, converting posteriors to soft factors through Monte Carlo marginalization, and aggregating factors via exact Sum-Product Network inference (LPF-SPN) or a learned neural aggregator (LPF-Learned). We prove seven formal guarantees spanning the key desiderata for trustworthy AI: Calibration Preservation (ECE <= epsilon + C/sqrt(K_eff)); Monte Carlo Error decaying as O(1/sqrt(M)); a non-vacuous PAC-Bayes bound with train-test gap of 0.0085 at N=4200; operation within 1.12x of the information-theoretic lower bound; graceful degradation as O(epsilon*delta*sqrt(K)) under corruption, maintaining 88% performance with half of evidence adversarially replaced; O(1/sqrt(K)) calibration decay with R^2=0.849; and exact epistemic-aleatoric uncertainty decomposition with error below 0.002%. All theorems are empirically validated on controlled datasets spanning up to 4,200 training examples. Our theoretical framework establishes LPF as a foundation for trustworthy multi-evidence AI in safety-critical applications.

Теоретические основы латентных апостериорных факторов: формальные гарантии для многодоказательного рассуждения

Theoretical Foundations of Latent Posterior Factors: Formal Guarantees for Multi-Evidence Reasoning

Аннотация

Support