ChatPaper.aiChatPaper

IA para la investigación automatizada: hoja de ruta y guía del usuario

AI for Auto-Research: Roadmap & User Guide

May 18, 2026
Autores: Lingdong Kong, Xian Sun, Wei Chow, Linfeng Li, Kevin Qinghong Lin, Xuan Billy Zhang, Song Wang, Rong Li, Qing Wu, Wei Gao, Yingshuo Wang, Shaoyuan Xie, Jiachen Liu, Leigang Qu, Shijie Li, Lai Xing Ng, Benoit R. Cottereau, Ziwei Liu, Tat-Seng Chua, Wei Tsang Ooi
cs.AI

Resumen

La investigación asistida por IA está cruzando un umbral: los sistemas completamente automatizados ya pueden generar artículos de investigación por tan solo 15 dólares, mientras que los agentes de largo horizonte pueden ejecutar experimentos, redactar manuscritos y simular críticas con una intervención humana mínima. Sin embargo, esta frontera de productividad revela un problema de integridad más profundo: bajo presión científica, incluso los LLM de frontera siguen fabricando resultados, pasando por alto errores ocultos y fallando al evaluar la novedad de manera fiable. Examinando los avances hasta abril de 2026, presentamos un análisis integral de la IA a lo largo del ciclo completo de investigación, organizado en cuatro fases epistemológicas: Creación (generación de ideas, revisión bibliográfica, codificación y experimentos, tablas y figuras), Escritura (redacción del artículo), Validación (revisión por pares, réplica y revisión) y Difusión (pósteres, diapositivas, videos, redes sociales, páginas de proyecto y agentes interactivos). Identificamos un límite nítido y dependiente de la etapa entre la asistencia confiable y la autonomía no confiable: la IA sobresale en tareas estructuradas, basadas en recuperación y mediadas por herramientas, pero sigue siendo frágil para ideas genuinamente novedosas, experimentos a nivel de investigación y juicio científico. Las ideas generadas a menudo se degradan tras su implementación, el código de investigación queda muy rezagado respecto a los puntos de referencia de reconocimiento de patrones, y los sistemas autónomos de extremo a extremo aún no han alcanzado de manera consistente los estándares de aceptación de las principales revistas. Además, mostramos que una mayor automatización puede ocultar, en lugar de eliminar, los modos de fallo, lo que convierte a la colaboración gobernada por humanos en el paradigma de despliegue más creíble. Finalmente, proporcionamos una taxonomía estructurada, un conjunto de puntos de referencia y un inventario de herramientas, principios de diseño transversales a las etapas y un manual orientado a profesionales, con recursos mantenidos en nuestra página del proyecto.
English
AI-assisted research is crossing a threshold: fully automated systems can now generate research papers for as little as $15, while long-horizon agents can execute experiments, draft manuscripts, and simulate critique with minimal human input. Yet this productivity frontier exposes a deeper integrity problem: under scientific pressure, even frontier LLMs still fabricate results, miss hidden errors, and fail to judge novelty reliably. Studying developments through April 2026, we present an end-to-end analysis of AI across the complete research lifecycle, organized into four epistemological phases: Creation (idea generation, literature review, coding & experiments, tables & figures), Writing (paper writing), Validation (peer review, rebuttal & revision), and Dissemination (posters, slides, videos, social media, project pages, and interactive agents). We identify a sharp, stage-dependent boundary between reliable assistance and unreliable autonomy: AI excels at structured, retrieval-grounded, and tool-mediated tasks, but remains fragile for genuinely novel ideas, research-level experiments, and scientific judgment. Generated ideas often degrade after implementation, research code lags far behind pattern-matching benchmarks, and end-to-end autonomous systems have not yet consistently reached major-venue acceptance standards. We further show that greater automation can obscure rather than eliminate failure modes, making human-governed collaboration the most credible deployment paradigm. Finally, we provide a structured taxonomy, benchmark suite, and tool inventory, cross-stage design principles, and a practitioner-oriented playbook, with resources maintained at our project page.