ChatPaper.aiChatPaper

AI voor geautomatiseerd onderzoek: Routekaart & gebruikershandleiding

AI for Auto-Research: Roadmap & User Guide

May 18, 2026
Auteurs: Lingdong Kong, Xian Sun, Wei Chow, Linfeng Li, Kevin Qinghong Lin, Xuan Billy Zhang, Song Wang, Rong Li, Qing Wu, Wei Gao, Yingshuo Wang, Shaoyuan Xie, Jiachen Liu, Leigang Qu, Shijie Li, Lai Xing Ng, Benoit R. Cottereau, Ziwei Liu, Tat-Seng Chua, Wei Tsang Ooi
cs.AI

Samenvatting

AI-ondersteund onderzoek overschrijdt een drempel: volledig geautomatiseerde systemen kunnen nu onderzoeksartikelen genereren voor slechts $15, terwijl agenten met een lange horizon experimenten kunnen uitvoeren, manuscripten kunnen opstellen en kritiek kunnen simuleren met minimale menselijke inbreng. Toch legt deze productiviteitsgrens een dieperliggend integriteitsprobleem bloot: onder wetenschappelijke druk verzinnen zelfs geavanceerde LLM's resultaten, zien ze verborgen fouten over het hoofd en zijn ze niet in staat om nieuwigheid betrouwbaar te beoordelen. Door ontwikkelingen tot april 2026 te bestuderen, presenteren we een end-to-end-analyse van AI over de volledige onderzoekslevenscyclus, georganiseerd in vier epistemologische fasen: Creatie (ideeëngeneratie, literatuuronderzoek, codering en experimenten, tabellen en figuren), Schrijven (het schrijven van papers), Validatie (peer review, weerwoord en revisie) en Disseminatie (posters, dia's, video's, sociale media, projectpagina's en interactieve agenten). We identificeren een scherpe, faseafhankelijke grens tussen betrouwbare assistentie en onbetrouwbare autonomie: AI blinkt uit in gestructureerde, op retrievel gebaseerde en tool-gemedieerde taken, maar blijft kwetsbaar voor werkelijk nieuwe ideeën, experimenten op onderzoeksniveau en wetenschappelijk oordeel. Gegenereerde ideeën verslechteren vaak na implementatie, onderzoekscode blijft ver achter bij patroonherkenningsbenchmarks, en end-to-end autonome systemen hebben nog niet consistent de acceptatienormen van grote conferenties gehaald. We tonen verder aan dat grotere automatisering faalwijzen kan verhullen in plaats van elimineren, waardoor mensgestuurde samenwerking het meest geloofwaardige implementatieparadigma is. Tot slot bieden we een gestructureerde taxonomie, benchmarksuite en toolinventaris, faseoverstijgende ontwerpprincipes en een praktijkgerichte handleiding, met bronnen die worden bijgehouden op onze projectpagina.
English
AI-assisted research is crossing a threshold: fully automated systems can now generate research papers for as little as $15, while long-horizon agents can execute experiments, draft manuscripts, and simulate critique with minimal human input. Yet this productivity frontier exposes a deeper integrity problem: under scientific pressure, even frontier LLMs still fabricate results, miss hidden errors, and fail to judge novelty reliably. Studying developments through April 2026, we present an end-to-end analysis of AI across the complete research lifecycle, organized into four epistemological phases: Creation (idea generation, literature review, coding & experiments, tables & figures), Writing (paper writing), Validation (peer review, rebuttal & revision), and Dissemination (posters, slides, videos, social media, project pages, and interactive agents). We identify a sharp, stage-dependent boundary between reliable assistance and unreliable autonomy: AI excels at structured, retrieval-grounded, and tool-mediated tasks, but remains fragile for genuinely novel ideas, research-level experiments, and scientific judgment. Generated ideas often degrade after implementation, research code lags far behind pattern-matching benchmarks, and end-to-end autonomous systems have not yet consistently reached major-venue acceptance standards. We further show that greater automation can obscure rather than eliminate failure modes, making human-governed collaboration the most credible deployment paradigm. Finally, we provide a structured taxonomy, benchmark suite, and tool inventory, cross-stage design principles, and a practitioner-oriented playbook, with resources maintained at our project page.