SciReasoner: Het Fundament Leggen voor Wetenschappelijk Redeneren Over Disciplines Heen

Samenvatting

We presenteren een wetenschappelijk redeneerfundamentmodel dat natuurlijke taal afstemt op heterogene wetenschappelijke representaties. Het model is voorgetraind op een corpus van 206B tokens, bestaande uit wetenschappelijke tekst, pure sequenties en sequentie-tekstparen, en vervolgens afgestemd via SFT op 40M instructies, geannealeerd cold-start bootstrapping om langere ketens van gedachten op te roepen, en reinforcement learning met taakspecifieke beloningsvorming, wat bewust wetenschappelijk redeneren bevordert. Het ondersteunt vier vermogensfamilies, die tot 103 taken in workflows omvatten: (i) getrouwe vertaling tussen tekst en wetenschappelijke formaten, (ii) tekst/kennis extractie, (iii) eigenschapvoorspelling, (iv) eigenschapclassificatie, (v) onvoorwaardelijke en voorwaardelijke sequentiegeneratie en ontwerp. In vergelijking met gespecialiseerde systemen, breidt onze aanpak de instructiedekking uit, verbetert de cross-domein generalisatie en verhoogt de trouw. We gaan in detail in op datacuratie en training en laten zien dat leren over disciplines heen de transfer en downstream betrouwbaarheid versterkt. Het model, de instructieafstemmingsdatasets en de evaluatiecode zijn open source beschikbaar op https://huggingface.co/SciReason en https://github.com/open-sciencelab/SciReason.

English

We present a scientific reasoning foundation model that aligns natural language with heterogeneous scientific representations. The model is pretrained on a 206B-token corpus spanning scientific text, pure sequences, and sequence-text pairs, then aligned via SFT on 40M instructions, annealed cold-start bootstrapping to elicit long-form chain-of-thought, and reinforcement learning with task-specific reward shaping, which instills deliberate scientific reasoning. It supports four capability families, covering up to 103 tasks across workflows: (i) faithful translation between text and scientific formats, (ii) text/knowledge extraction, (iii) property prediction, (iv) property classification, (v) unconditional and conditional sequence generation and design. Compared with specialist systems, our approach broadens instruction coverage, improves cross-domain generalization, and enhances fidelity. We detail data curation and training and show that cross-discipline learning strengthens transfer and downstream reliability. The model, instruct tuning datasets and the evaluation code are open-sourced at https://huggingface.co/SciReason and https://github.com/open-sciencelab/SciReason.

SciReasoner: Het Fundament Leggen voor Wetenschappelijk Redeneren Over Disciplines Heen

SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines

Samenvatting

Support