ChatPaper.aiChatPaper

AION-1: Omnimodaal Fundamentmodel voor Astronomische Wetenschappen

AION-1: Omnimodal Foundation Model for Astronomical Sciences

October 20, 2025
Auteurs: Liam Parker, Francois Lanusse, Jeff Shen, Ollie Liu, Tom Hehir, Leopoldo Sarra, Lucas Meyer, Micah Bowles, Sebastian Wagner-Carena, Helen Qu, Siavash Golkar, Alberto Bietti, Hatim Bourfoune, Nathan Casserau, Pierre Cornette, Keiya Hirashima, Geraud Krawezik, Ruben Ohana, Nicholas Lourie, Michael McCabe, Rudy Morel, Payel Mukhopadhyay, Mariel Pettee, Bruno Regaldo-Saint Blancard, Kyunghyun Cho, Miles Cranmer, Shirley Ho
cs.AI

Samenvatting

Hoewel foundation models veelbelovend zijn gebleken in diverse vakgebieden, ontbreekt er in de astronomie nog steeds een uniform raamwerk voor gezamenlijke modellering van de zeer uiteenlopende datamodaliteiten. In dit artikel presenteren we AION-1, een familie van grootschalige multimodale foundation models voor astronomie. AION-1 integreert heterogene beeld-, spectroscopische en scalaire gegevens met behulp van een tweestapsarchitectuur: modaliteit-specifieke tokenisatie gevolgd door transformer-gebaseerde gemaskeerde modellering van kruismodale tokenreeksen. Het model is voorgetraind op vijf grootschalige surveys: Legacy Survey, Hyper Suprime-Cam (HSC), Sloan Digital Sky Survey (SDSS), Dark Energy Spectroscopic Instrument (DESI) en Gaia. Deze omvatten meer dan 200 miljoen waarnemingen van sterren, sterrenstelsels en quasars. Met een enkele bevroren encoder behaalt AION-1 sterke resultaten op een breed scala aan downstream taken, waaronder schatting van eigenschappen van sterrenstelsels en sterren, classificatie van sterrenstelselmorfologie, op gelijkenis gebaseerde retrievals, segmentatie van sterrenstelselbeelden en spectrale superresolutie. We brengen AION-1 modelvarianten uit met een bereik van 300 M tot 3,1 B parameters. Naast astronomie biedt AION-1 een schaalbaar blauwdruk voor multimodale wetenschappelijke foundation models die naadloos ruisgevoelige, instrument-specifieke waarnemingen kunnen integreren. Alle code, tokenizers, voorgetrainde gewichten en een lichtgewicht evaluatiesuite worden vrijgegeven onder een open-source licentie.
English
While foundation models have shown promise across a variety of fields, astronomy still lacks a unified framework for joint modeling across its highly diverse data modalities. In this paper, we present AION-1, a family of large-scale multimodal foundation models for astronomy. AION-1 integrates heterogeneous imaging, spectroscopic, and scalar data using a two-stage architecture: modality-specific tokenization followed by transformer-based masked modeling of cross-modal token sequences. The model is pretrained on five large-scale surveys: Legacy Survey, Hyper Suprime-Cam (HSC), Sloan Digital Sky Survey (SDSS), Dark Energy Spectroscopic Instrument (DESI), and Gaia. These span more than 200 million observations of stars, galaxies, and quasars. With a single frozen encoder, AION-1 achieves strong results on a broad suite of downstream tasks, including galaxy and stellar property estimation, galaxy morphology classification, similarity-based retrieval, galaxy image segmentation, and spectral super-resolution. We release AION-1 model variants ranging from 300 M to 3.1 B parameters. Beyond astronomy, AION-1 provides a scalable blueprint for multimodal scientific foundation models that can seamlessly integrate noisy, instrument-specific observations. All code, tokenizers, pretrained weights, and a lightweight evaluation suite are released under an open-source license.
PDF252October 22, 2025