Café de Papel: De la Sobrecarga de Documentos a la Perspectiva Investigadora
Paper Espresso: From Paper Overload to Research Insight
April 6, 2026
Autores: Mingzhe Du, Luu Anh Tuan, Dong Huang, See-kiong Ng
cs.AI
Resumen
El ritmo acelerado de las publicaciones científicas dificulta cada vez más que los investigadores se mantengan al día. Presentamos Paper Espresso, una plataforma de código abierto que descubre, resume y analiza automáticamente artículos de arXiv en tendencia. El sistema utiliza modelos de lenguaje grande (LLMs) para generar resúmenes estructurados con etiquetas temáticas y palabras clave, y proporciona análisis de tendencias a múltiples escalas (diaria, semanal y mensual) mediante la consolidación de temas impulsada por LLMs. Tras más de 35 meses de despliegue continuo, Paper Espresso ha procesado más de 13,300 artículos y ha publicado públicamente todos los metadatos estructurados, revelando dinámicas ricas en el panorama de la investigación en IA: un aumento a mediados de 2025 en el aprendizaje por refuerzo para el razonamiento con LLMs, la emergencia no saturante de temas (6,673 temas únicos) y una correlación positiva entre la novedad temática y la participación de la comunidad (2.0x más votos positivos en la mediana para los artículos más novedosos). Una demostración en vivo está disponible en https://huggingface.co/spaces/Elfsong/Paper_Espresso.
English
The accelerating pace of scientific publishing makes it increasingly difficult for researchers to stay current. We present Paper Espresso, an open-source platform that automatically discovers, summarizes, and analyzes trending arXiv papers. The system uses large language models (LLMs) to generate structured summaries with topical labels and keywords, and provides multi-granularity trend analysis at daily, weekly, and monthly scales through LLM-driven topic consolidation. Over 35 months of continuous deployment, Paper Espresso has processed over 13,300 papers and publicly released all structured metadata, revealing rich dynamics in the AI research landscape: a mid-2025 surge in reinforcement learning for LLM reasoning, non-saturating topic emergence (6,673 unique topics), and a positive correlation between topic novelty and community engagement (2.0x median upvotes for the most novel papers). A live demo is available at https://huggingface.co/spaces/Elfsong/Paper_Espresso.