ChatPaper.aiChatPaper

AION-1: Omnimodales Grundlagenmodell für die astronomischen Wissenschaften

AION-1: Omnimodal Foundation Model for Astronomical Sciences

October 20, 2025
papers.authors: Liam Parker, Francois Lanusse, Jeff Shen, Ollie Liu, Tom Hehir, Leopoldo Sarra, Lucas Meyer, Micah Bowles, Sebastian Wagner-Carena, Helen Qu, Siavash Golkar, Alberto Bietti, Hatim Bourfoune, Nathan Casserau, Pierre Cornette, Keiya Hirashima, Geraud Krawezik, Ruben Ohana, Nicholas Lourie, Michael McCabe, Rudy Morel, Payel Mukhopadhyay, Mariel Pettee, Bruno Regaldo-Saint Blancard, Kyunghyun Cho, Miles Cranmer, Shirley Ho
cs.AI

papers.abstract

Während Foundation-Modelle in verschiedenen Bereichen vielversprechende Ergebnisse gezeigt haben, fehlt in der Astronomie noch ein einheitliches Framework für die gemeinsame Modellierung ihrer äußerst vielfältigen Datenmodalitäten. In diesem Artikel stellen wir AION-1 vor, eine Familie von großskaligen multimodalen Foundation-Modellen für die Astronomie. AION-1 integriert heterogene Bild-, Spektral- und skalare Daten mithilfe einer zweistufigen Architektur: modalspezifische Tokenisierung gefolgt von einer transformer-basierten Masked Modeling von cross-modalen Token-Sequenzen. Das Modell wird auf fünf großangelegten Surveys vortrainiert: Legacy Survey, Hyper Suprime-Cam (HSC), Sloan Digital Sky Survey (SDSS), Dark Energy Spectroscopic Instrument (DESI) und Gaia. Diese umfassen mehr als 200 Millionen Beobachtungen von Sternen, Galaxien und Quasaren. Mit einem einzigen eingefrorenen Encoder erzielt AION-1 starke Ergebnisse bei einer Vielzahl von Downstream-Aufgaben, darunter die Schätzung von Galaxien- und Sterneigenschaften, die Klassifizierung von Galaxienmorphologien, ähnlichkeitsbasierte Retrieval, Galaxienbildsegmentierung und spektrale Super-Resolution. Wir veröffentlichen AION-1-Modellvarianten mit einer Größe von 300 M bis 3,1 B Parametern. Über die Astronomie hinaus bietet AION-1 einen skalierbaren Blueprint für multimodale wissenschaftliche Foundation-Modelle, die rauschbehaftete, instrumentenspezifische Beobachtungen nahtlos integrieren können. Der gesamte Code, Tokenizer, vortrainierte Gewichte und ein leichtgewichtiges Evaluationssuite werden unter einer Open-Source-Lizenz veröffentlicht.
English
While foundation models have shown promise across a variety of fields, astronomy still lacks a unified framework for joint modeling across its highly diverse data modalities. In this paper, we present AION-1, a family of large-scale multimodal foundation models for astronomy. AION-1 integrates heterogeneous imaging, spectroscopic, and scalar data using a two-stage architecture: modality-specific tokenization followed by transformer-based masked modeling of cross-modal token sequences. The model is pretrained on five large-scale surveys: Legacy Survey, Hyper Suprime-Cam (HSC), Sloan Digital Sky Survey (SDSS), Dark Energy Spectroscopic Instrument (DESI), and Gaia. These span more than 200 million observations of stars, galaxies, and quasars. With a single frozen encoder, AION-1 achieves strong results on a broad suite of downstream tasks, including galaxy and stellar property estimation, galaxy morphology classification, similarity-based retrieval, galaxy image segmentation, and spectral super-resolution. We release AION-1 model variants ranging from 300 M to 3.1 B parameters. Beyond astronomy, AION-1 provides a scalable blueprint for multimodal scientific foundation models that can seamlessly integrate noisy, instrument-specific observations. All code, tokenizers, pretrained weights, and a lightweight evaluation suite are released under an open-source license.
PDF252October 22, 2025