Paper Espresso: Do Excesso de Documentos à Intuição em Pesquisa

Resumo

O ritmo acelerado das publicações científicas torna cada vez mais difícil para os investigadores manterem-se atualizados. Apresentamos o Paper Espresso, uma plataforma de código aberto que descobre, resume e analisa automaticamente artigos em tendência no arXiv. O sistema utiliza modelos de linguagem de grande escala (LLMs) para gerar resumos estruturados com etiquetas temáticas e palavras-chave, e fornece análise de tendências em múltiplas granularidades (diária, semanal e mensal) através da consolidação de tópicos orientada por LLMs. Ao longo de 35 meses de implementação contínua, o Paper Espresso processou mais de 13 300 artigos e disponibilizou publicamente todos os metadados estruturados, revelando dinâmicas ricas no panorama da investigação em IA: um pico em meados de 2025 em aprendizagem por reforço para raciocínio com LLMs, a emergência não saturada de tópicos (6 673 tópicos únicos) e uma correlação positiva entre a novidade do tópico e o envolvimento da comunidade (2,0x mais votos positivos medianos para os artigos mais inovadores). Uma demonstração ao vivo está disponível em https://huggingface.co/spaces/Elfsong/Paper_Espresso.

English

The accelerating pace of scientific publishing makes it increasingly difficult for researchers to stay current. We present Paper Espresso, an open-source platform that automatically discovers, summarizes, and analyzes trending arXiv papers. The system uses large language models (LLMs) to generate structured summaries with topical labels and keywords, and provides multi-granularity trend analysis at daily, weekly, and monthly scales through LLM-driven topic consolidation. Over 35 months of continuous deployment, Paper Espresso has processed over 13,300 papers and publicly released all structured metadata, revealing rich dynamics in the AI research landscape: a mid-2025 surge in reinforcement learning for LLM reasoning, non-saturating topic emergence (6,673 unique topics), and a positive correlation between topic novelty and community engagement (2.0x median upvotes for the most novel papers). A live demo is available at https://huggingface.co/spaces/Elfsong/Paper_Espresso.