Paper Espresso: Dalla Sovrabbondanza di Carte all'Intuizione della Ricerca
Paper Espresso: From Paper Overload to Research Insight
April 6, 2026
Autori: Mingzhe Du, Luu Anh Tuan, Dong Huang, See-kiong Ng
cs.AI
Abstract
Il ritmo crescente delle pubblicazioni scientifiche rende sempre più difficile per i ricercatori mantenersi aggiornati. Presentiamo Paper Espresso, una piattaforma open-source che scopre, riassume e analizza automaticamente i paper di tendenza su arXiv. Il sistema utilizza grandi modelli linguistici (LLM) per generare riassunti strutturati con etichette tematiche e parole chiave, e fornisce un'analisi delle tendenze a granularità multipla (giornaliera, settimanale e mensile) attraverso la consolidazione di argomenti guidata da LLM. In 35 mesi di deployment continuativo, Paper Espresso ha processato oltre 13.300 paper e rilasciato pubblicamente tutti i metadati strutturati, rivelando una dinamica ricca nel panorama della ricerca sull'IA: un picco a metà 2025 nell'apprendimento per rinforzo per il ragionamento degli LLM, un'emergenza di topic non saturante (6.673 topic unici), e una correlazione positiva tra la novità del topic e il coinvolgimento della comunità (2.0x il numero mediano di upvote per i paper più innovativi). Una demo live è disponibile all'indirizzo https://huggingface.co/spaces/Elfsong/Paper_Espresso.
English
The accelerating pace of scientific publishing makes it increasingly difficult for researchers to stay current. We present Paper Espresso, an open-source platform that automatically discovers, summarizes, and analyzes trending arXiv papers. The system uses large language models (LLMs) to generate structured summaries with topical labels and keywords, and provides multi-granularity trend analysis at daily, weekly, and monthly scales through LLM-driven topic consolidation. Over 35 months of continuous deployment, Paper Espresso has processed over 13,300 papers and publicly released all structured metadata, revealing rich dynamics in the AI research landscape: a mid-2025 surge in reinforcement learning for LLM reasoning, non-saturating topic emergence (6,673 unique topics), and a positive correlation between topic novelty and community engagement (2.0x median upvotes for the most novel papers). A live demo is available at https://huggingface.co/spaces/Elfsong/Paper_Espresso.