ChatPaper.aiChatPaper

Надежные и ответственные базовые модели: всесторонний обзор

Reliable and Responsible Foundation Models: A Comprehensive Survey

February 4, 2026
Авторы: Xinyu Yang, Junlin Han, Rishi Bommasani, Jinqi Luo, Wenjie Qu, Wangchunshu Zhou, Adel Bibi, Xiyao Wang, Jaehong Yoon, Elias Stengel-Eskin, Shengbang Tong, Lingfeng Shen, Rafael Rafailov, Runjia Li, Zhaoyang Wang, Yiyang Zhou, Chenhang Cui, Yu Wang, Wenhao Zheng, Huichi Zhou, Jindong Gu, Zhaorun Chen, Peng Xia, Tony Lee, Thomas Zollo, Vikash Sehwag, Jixuan Leng, Jiuhai Chen, Yuxin Wen, Huan Zhang, Zhun Deng, Linjun Zhang, Pavel Izmailov, Pang Wei Koh, Yulia Tsvetkov, Andrew Wilson, Jiaheng Zhang, James Zou, Cihang Xie, Hao Wang, Philip Torr, Julian McAuley, David Alvarez-Melis, Florian Tramèr, Kaidi Xu, Suman Jana, Chris Callison-Burch, Rene Vidal, Filippos Kokkinos, Mohit Bansal, Beidi Chen, Huaxiu Yao
cs.AI

Аннотация

Фундаментальные модели, включая большие языковые модели (LLM), мультимодальные большие языковые модели (MLLM), модели генерации изображений (такие как модели "текст-изображение" и модели редактирования изображений) и модели генерации видео, стали важнейшими инструментами с широким спектром применений в различных областях, таких как право, медицина, образование, финансы, наука и другие. По мере того как эти модели находят все большее практическое применение, обеспечение их надежности и ответственности стало критически важной задачей для академического сообщества, промышленности и государства. Данный обзор посвящен надежной и ответственной разработке фундаментальных моделей. Мы исследуем ключевые проблемы, включая смещение и справедливость, безопасность и конфиденциальность, неопределенность, интерпретируемость и сдвиг распределения. Наше исследование также охватывает ограничения моделей, такие как галлюцинации, а также методы, такие как согласование (alignment) и детектирование контента, созданного искусственным интеллектом (AIGC). Для каждой области мы рассматриваем текущее состояние дел и намечаем конкретные направления будущих исследований. Кроме того, мы обсуждаем точки пересечения между этими областями, подчеркивая их взаимосвязи и общие проблемы. Мы надеемся, что наш обзор будет способствовать разработке фундаментальных моделей, которые не только мощны, но и этичны, заслуживают доверия, надежны и социально ответственны.
English
Foundation models, including Large Language Models (LLMs), Multimodal Large Language Models (MLLMs), Image Generative Models (i.e, Text-to-Image Models and Image-Editing Models), and Video Generative Models, have become essential tools with broad applications across various domains such as law, medicine, education, finance, science, and beyond. As these models see increasing real-world deployment, ensuring their reliability and responsibility has become critical for academia, industry, and government. This survey addresses the reliable and responsible development of foundation models. We explore critical issues, including bias and fairness, security and privacy, uncertainty, explainability, and distribution shift. Our research also covers model limitations, such as hallucinations, as well as methods like alignment and Artificial Intelligence-Generated Content (AIGC) detection. For each area, we review the current state of the field and outline concrete future research directions. Additionally, we discuss the intersections between these areas, highlighting their connections and shared challenges. We hope our survey fosters the development of foundation models that are not only powerful but also ethical, trustworthy, reliable, and socially responsible.
PDF82February 11, 2026