Papier-Espresso: Von der Papierflut zur Forschungserkenntnis
Paper Espresso: From Paper Overload to Research Insight
April 6, 2026
Autoren: Mingzhe Du, Luu Anh Tuan, Dong Huang, See-kiong Ng
cs.AI
Zusammenfassung
Das beschleunigte Tempo wissenschaftlicher Veröffentlichungen erschwert es Forschenden zunehmend, auf dem aktuellen Stand zu bleiben. Wir stellen Paper Espresso vor, eine Open-Source-Plattform, die automatisch aktuelle arXiv-Papers entdeckt, zusammenfasst und analysiert. Das System nutzt große Sprachmodelle (LLMs), um strukturierte Zusammenfassungen mit thematischen Labels und Schlüsselwörtern zu generieren, und bietet durch LLM-gestützte Themenkonsolidierung eine Mehrgranularitäts-Trendanalyse auf täglicher, wöchentlicher und monatlicher Ebene. Über einen Zeitraum von 35 Monaten kontinuierlichen Betriebs hat Paper Espresso mehr als 13.300 Paper verarbeitet und alle strukturierten Metadaten öffentlich freigegeben. Dies offenbart reichhaltige Dynamiken in der KI-Forschungslandschaft: einen starken Anstieg von Reinforcement Learning für LLM-Reasoning Mitte 2025, nicht-sättigende Themenentstehung (6.673 einzigartige Themen) und eine positive Korrelation zwischen Themenneuheit und Community-Beteiligung (2,0-fache mittlere Upvotes für die innovativsten Papers). Eine Live-Demo ist verfügbar unter https://huggingface.co/spaces/Elfsong/Paper_Espresso.
English
The accelerating pace of scientific publishing makes it increasingly difficult for researchers to stay current. We present Paper Espresso, an open-source platform that automatically discovers, summarizes, and analyzes trending arXiv papers. The system uses large language models (LLMs) to generate structured summaries with topical labels and keywords, and provides multi-granularity trend analysis at daily, weekly, and monthly scales through LLM-driven topic consolidation. Over 35 months of continuous deployment, Paper Espresso has processed over 13,300 papers and publicly released all structured metadata, revealing rich dynamics in the AI research landscape: a mid-2025 surge in reinforcement learning for LLM reasoning, non-saturating topic emergence (6,673 unique topics), and a positive correlation between topic novelty and community engagement (2.0x median upvotes for the most novel papers). A live demo is available at https://huggingface.co/spaces/Elfsong/Paper_Espresso.