Zuverlässige und verantwortungsvolle Foundation Models: Eine umfassende Übersicht
Reliable and Responsible Foundation Models: A Comprehensive Survey
February 4, 2026
papers.authors: Xinyu Yang, Junlin Han, Rishi Bommasani, Jinqi Luo, Wenjie Qu, Wangchunshu Zhou, Adel Bibi, Xiyao Wang, Jaehong Yoon, Elias Stengel-Eskin, Shengbang Tong, Lingfeng Shen, Rafael Rafailov, Runjia Li, Zhaoyang Wang, Yiyang Zhou, Chenhang Cui, Yu Wang, Wenhao Zheng, Huichi Zhou, Jindong Gu, Zhaorun Chen, Peng Xia, Tony Lee, Thomas Zollo, Vikash Sehwag, Jixuan Leng, Jiuhai Chen, Yuxin Wen, Huan Zhang, Zhun Deng, Linjun Zhang, Pavel Izmailov, Pang Wei Koh, Yulia Tsvetkov, Andrew Wilson, Jiaheng Zhang, James Zou, Cihang Xie, Hao Wang, Philip Torr, Julian McAuley, David Alvarez-Melis, Florian Tramèr, Kaidi Xu, Suman Jana, Chris Callison-Burch, Rene Vidal, Filippos Kokkinos, Mohit Bansal, Beidi Chen, Huaxiu Yao
cs.AI
papers.abstract
Foundation Models, einschließlich Large Language Models (LLMs), Multimodaler Large Language Models (MLLMs), Bildgenerierungsmodellen (d. h. Text-zu-Bild-Modelle und Bildbearbeitungsmodelle) und Videogenerierungsmodellen, haben sich zu essenziellen Werkzeugen mit breiten Anwendungen in verschiedenen Bereichen wie Recht, Medizin, Bildung, Finanzen, Wissenschaft und darüber hinaus entwickelt. Da diese Modelle zunehmend im realen Einsatz sind, ist die Gewährleistung ihrer Zuverlässigkeit und Verantwortung für Wissenschaft, Industrie und Regierungen von kritischer Bedeutung. Dieser Übersichtsartikel behandelt die zuverlässige und verantwortungsvolle Entwicklung von Foundation Models. Wir untersuchen kritische Themen, einschließlich Verzerrung und Fairness, Sicherheit und Privatsphäre, Unsicherheit, Erklärbarkeit und Distributionsverschiebung. Unsere Forschung behandelt auch Modellbeschränkungen, wie Halluzinationen, sowie Methoden wie Alignment und die Erkennung von KI-generierten Inhalten (AIGC). Für jeden Bereich geben wir einen Überblick über den aktuellen Stand des Feldes und skizzieren konkrete zukünftige Forschungsrichtungen. Zusätzlich diskutieren wir die Schnittstellen zwischen diesen Bereichen, heben ihre Verbindungen und gemeinsamen Herausforderungen hervor. Wir hoffen, dass unser Übersichtsartikel die Entwicklung von Foundation Models fördert, die nicht nur leistungsstark, sondern auch ethisch, vertrauenswürdig, zuverlässig und gesellschaftlich verantwortungsvoll sind.
English
Foundation models, including Large Language Models (LLMs), Multimodal Large Language Models (MLLMs), Image Generative Models (i.e, Text-to-Image Models and Image-Editing Models), and Video Generative Models, have become essential tools with broad applications across various domains such as law, medicine, education, finance, science, and beyond. As these models see increasing real-world deployment, ensuring their reliability and responsibility has become critical for academia, industry, and government. This survey addresses the reliable and responsible development of foundation models. We explore critical issues, including bias and fairness, security and privacy, uncertainty, explainability, and distribution shift. Our research also covers model limitations, such as hallucinations, as well as methods like alignment and Artificial Intelligence-Generated Content (AIGC) detection. For each area, we review the current state of the field and outline concrete future research directions. Additionally, we discuss the intersections between these areas, highlighting their connections and shared challenges. We hope our survey fosters the development of foundation models that are not only powerful but also ethical, trustworthy, reliable, and socially responsible.