ChatPaper.aiChatPaper.ai
Startseite

arXiv

HuggingFace

PreiseKontoArbeitsbereich

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

KI-Forschungspapiere Täglich

Täglich kuratierte KI-Forschungspapiere mit Übersetzungen

Wird es morgen noch wahr sein? Multilinguale Klassifikation von zeitbeständigen Fragen zur Verbesserung vertrauenswürdiger Frage-Antwort-Systeme
Will It Still Be True Tomorrow? Multilingual Evergreen Question Classification to Improve Trustworthy QA

Sergey Pletenev, Maria Marina, Nikolay Ivanov, Daria Galimzianova, Nikita Krayko, Mikhail Salnikov, Vasily Konovalov, Alexander Panchenko, Viktor Moskvoretskii•May 27, 2025•1114

Nutzung von Self-Attention für eingabeabhängiges Soft Prompting in LLMs
Leveraging Self-Attention for Input-Dependent Soft Prompting in LLMs

Ananth Muppidi, Abhilash Nandy, Sambaran Bandyopadhyay•Jun 5, 2025•322

MORSE-500: Ein programmatisch steuerbarer Video-Benchmark zur Belastungsprüfung multimodalen Denkens
MORSE-500: A Programmatically Controllable Video Benchmark to Stress-Test Multimodal Reasoning

Zikui Cai, Andrew Wang, Anirudh Satheesh, Ankit Nakhawa, Hyunwoo Jae, Keenan Powell, Minghui Liu, Neel Jay, Sungbin Oh, Xiyao Wang, Yongyuan Liang, Tom Goldstein, Furong Huang•Jun 5, 2025•312

FusionAudio-1.2M: Auf dem Weg zu feingranularer Audio-Beschreibung mit multimodaler kontextueller Fusion
FusionAudio-1.2M: Towards Fine-grained Audio Captioning with Multimodal Contextual Fusion

Shunian Chen, Xinyuan Xie, Zheshu Chen, Liyan Zhao, Owen Lee, Zhan Su, Qilin Sun, Benyou Wang•Jun 1, 2025•292

PartCrafter: Strukturierte 3D-Mesh-Generierung durch kompositionelle latente Diffusions-Transformatoren
PartCrafter: Structured 3D Mesh Generation via Compositional Latent Diffusion Transformers

Yuchen Lin, Chenguo Lin, Panwang Pan, Honglei Yan, Yiqiang Feng, Yadong Mu, Katerina Fragkiadaki•Jun 5, 2025•283

Wahrheit in den Wenigen: Auswahl hochwertiger Daten für effizientes multimodales Schließen
Truth in the Few: High-Value Data Selection for Efficient Multi-Modal Reasoning

Shenshen Li, Kaiyuan Deng, Lei Wang, Hao Yang, Chong Peng, Peng Yan, Fumin Shen, Heng Tao Shen, Xing Xu•Jun 5, 2025•252

Sentinel: SOTA-Modell zum Schutz vor Prompt-Injections
Sentinel: SOTA model to protect against prompt injections

Dror Ivry, Oran Nahum•Jun 5, 2025•212

Ist die Erweiterung der Modalität der richtige Weg zur Omni-Modalität?
Is Extending Modality The Right Path Towards Omni-Modality?

Tinghui Zhu, Kai Zhang, Muhao Chen, Yu Su•Jun 2, 2025•192

STARFlow: Skalierung latenter Normalizing Flows für die Synthese hochauflösender Bilder
STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis

Jiatao Gu, Tianrong Chen, David Berthelot, Huangjie Zheng, Yuyang Wang, Ruixiang Zhang, Laurent Dinh, Miguel Angel Bautista, Josh Susskind, Shuangfei Zhai•Jun 6, 2025•182

Audio-bewusste Large Language Models als Bewerter für Sprechstile
Audio-Aware Large Language Models as Judges for Speaking Styles

Cheng-Han Chiang, Xiaofei Wang, Chung-Ching Lin, Kevin Lin, Linjie Li, Radu Kopetz, Yao Qian, Zhendong Wang, Zhengyuan Yang, Hung-yi Lee, Lijuan Wang•Jun 6, 2025•144

Medizinisches Weltmodell: Generative Simulation der Tumorentwicklung für die Behandlungsplanung
Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning

Yijun Yang, Zhao-Yang Wang, Qiuping Liu, Shuwen Sun, Kang Wang, Rama Chellappa, Zongwei Zhou, Alan Yuille, Lei Zhu, Yu-Dong Zhang, Jieneng Chen•Jun 2, 2025•132

CodeContests+: Hochwertige Testfallgenerierung für Wettbewerbsprogrammierung
CodeContests+: High-Quality Test Case Generation for Competitive Programming

Zihan Wang, Siyao Liu, Yang Sun, Hongyan Li, Kai Shen•Jun 6, 2025•82

Peer-Ranked Precision: Erstellung eines Grundlagendatensatzes für das Feinabstimmen von Vision-Modellen aus den annotierten Bilddaten von DataSeeds
Peer-Ranked Precision: Creating a Foundational Dataset for Fine-Tuning Vision Models from DataSeeds' Annotated Imagery

Sajjad Abdoli, Freeman Lewin, Gediminas Vasiliauskas, Fabian Schonholz•Jun 6, 2025•82

Splatting physischer Szenen: End-to-End Real-to-Sim aus unvollkommenen Roboter-Daten
Splatting Physical Scenes: End-to-End Real-to-Sim from Imperfect Robot Data

Ben Moran, Mauro Comi, Steven Bohez, Tom Erez, Zhibin Li, Leonard Hasenclever•Jun 4, 2025•72

Brücken zwischen Perspektiven: Eine Übersicht zur kollaborativen Intelligenz über Sichtweisen hinweg mit egozentrischer und exozentrischer Vision
Bridging Perspectives: A Survey on Cross-view Collaborative Intelligence with Egocentric-Exocentric Vision

Yuping He, Yifei Huang, Guo Chen, Lidong Lu, Baoqi Pei, Jilan Xu, Tong Lu, Yoichi Sato•Jun 6, 2025•62

3DFlowAction: Erlernen von manipulationsfähigen Fähigkeiten über verschiedene Embodiments in der 3D-Flow-Welt
3DFlowAction: Learning Cross-Embodiment Manipulation from 3D Flow World Model

Hongyan Zhi, Peihao Chen, Siyuan Zhou, Yubo Dong, Quanxi Wu, Lei Han, Mingkui Tan•Jun 6, 2025•52

MIRIAD: Erweiterung von LLMs mit Millionen von medizinischen Frage-Antwort-Paaren
MIRIAD: Augmenting LLMs with millions of medical query-response pairs

Qinyue Zheng, Salman Abdullah, Sam Rawal, Cyril Zakka, Sophie Ostmeier, Maximilian Purk, Eduardo Reis, Eric J. Topol, Jure Leskovec, Michael Moor•Jun 6, 2025•52

HASHIRU: Hierarchisches Agentensystem für hybride intelligente Ressourcennutzung
HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization

Kunal Pai, Parth Shah, Harshil Patel•Jun 1, 2025•52

Prefix Grouper: Effizientes GRPO-Training durch Shared-Prefix Forward
Prefix Grouper: Efficient GRPO Training through Shared-Prefix Forward

Zikang Liu, Tongtian Yue, Yepeng Tang, Longteng Guo, Junxian Cai, Qingbin Liu, Xi Chen, Jing Liu•Jun 5, 2025•42

Wenn Modelle mehr wissen, als sie erklären können: Quantifizierung des Wissenstransfers in der Mensch-KI-Kollaboration
When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration

Quan Shi, Carlos E. Jimenez, Shunyu Yao, Nick Haber, Diyi Yang, Karthik Narasimhan•Jun 5, 2025•32

Wenn Semantik die Sicht trübt: Minderung von Halluzinationen in großen multimodalen Modellen bei der Erkennung und Interpretation von Szenentexten
When Semantics Mislead Vision: Mitigating Large Multimodal Models Hallucinations in Scene Text Spotting and Understanding

Yan Shu, Hangui Lin, Yexin Liu, Yan Zhang, Gangyan Zeng, Yan Li, Yu Zhou, Ser-Nam Lim, Harry Yang, Nicu Sebe•Jun 5, 2025•32

GuideX: Geführte synthetische Datengenerierung für Zero-Shot Informationsextraktion
GuideX: Guided Synthetic Data Generation for Zero-Shot Information Extraction

Neil De La Fuente, Oscar Sainz, Iker García-Ferrero, Eneko Agirre•May 31, 2025•32

AssetOpsBench: Benchmarking von KI-Agenten zur Aufgabenautomatisierung in der industriellen Anlagenbetriebs- und Instandhaltung
AssetOpsBench: Benchmarking AI Agents for Task Automation in Industrial Asset Operations and Maintenance

Dhaval Patel, Shuxin Lin, James Rayfield, Nianjun Zhou, Roman Vaculin, Natalia Martinez, Fearghal O'donncha, Jayant Kalagnanam•Jun 4, 2025•12

Sparsifizierte State-Space-Modelle sind effiziente Highway-Netzwerke.
Sparsified State-Space Models are Efficient Highway Networks

Woomin Song, Jihoon Tack, Sangwoo Mo, Seunghyuk Oh, Jinwoo Shin•May 27, 2025•12