Toto 2.0: Zeitreihenprognose tritt in die Skalierungsära ein

Zusammenfassung

Wir zeigen, dass Zeitreihen-Foundation-Modelle skalieren: Ein einziges Trainingsrezept führt zu zuverlässigen Verbesserungen der Prognosequalität von 4 Millionen bis 2,5 Milliarden Parametern. Wir veröffentlichen Toto 2.0, eine Familie von fünf Open-Weights-Prognosemodellen, die unter diesem Rezept trainiert wurden. Die Toto-2.0-Familie setzt einen neuen Stand der Technik auf drei Prognose-Benchmarks: BOOM, unserem Observability-Benchmark; GIFT-Eval, dem standardmäßigen Allzweck-Benchmark; und dem aktuellen kontaminierungsresistenten TIME-Benchmark. Dieser Bericht beschreibt unsere experimentellen Ergebnisse und erläutert die Entwurfsentscheidungen hinter Toto 2.0: seine Architektur und das Trainingsrezept, die Trainingsdaten und die u-muP-Hyperparameter-Transfer-Pipeline. Alle fünf Basis-Checkpoints werden unter Apache 2.0 veröffentlicht.

English

We show that time series foundation models scale: a single training recipe produces reliable forecast-quality improvements from 4M to 2.5B parameters. We release Toto 2.0, a family of five open-weights forecasting models trained under this recipe. The Toto 2.0 family sets a new state of the art on three forecasting benchmarks: BOOM, our observability benchmark; GIFT-Eval, the standard general-purpose benchmark; and the recent contamination-resistant TIME benchmark. This report describes our experimental results and details the design decisions behind Toto 2.0: its architecture and training recipe, training data, and the u-muP hyperparameter transfer pipeline. All five base checkpoints are released under Apache 2.0.