ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
May 2nd, 2025
DeepCritic: Gezielte Kritik mit großen Sprachmodellen
DeepCritic: Deliberate Critique with Large Language Models
Wenkai Yang, Jingwen Chen, Yankai Lin, Ji-Rong Wen
•
May 1, 2025
•
44
7
Eine Übersicht über interaktive generative Videoerzeugung
A Survey of Interactive Generative Video
Jiwen Yu, Yiran Qin, Haoxuan Che, Quande Liu, Xintao Wang, Pengfei Wan, Di Zhang, Kun Gai, Hao Chen, Xihui Liu
•
Apr 30, 2025
•
42
1
T2I-R1: Verstärkung der Bildgenerierung durch kollaborative semantische und tokenbasierte CoT
T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT
Dongzhi Jiang, Ziyu Guo, Renrui Zhang, Zhuofan Zong, Hao Li, Le Zhuo, Shilin Yan, Pheng-Ann Heng, Hongsheng Li
•
May 1, 2025
•
37
1
Selbstgenerierte In-Kontext-Beispiele verbessern LLM-Agenten für sequenzielle Entscheidungsfindungsaufgaben
Self-Generated In-Context Examples Improve LLM Agents for Sequential Decision-Making Tasks
Vishnu Sarukkai, Zhiqiang Xie, Kayvon Fatahalian
•
May 1, 2025
•
18
1
KeySync: Ein robustes Verfahren für die verlustfreie Lippensynchronisation in hoher Auflösung
KeySync: A Robust Approach for Leakage-free Lip Synchronization in High Resolution
Antoni Bigata, Rodrigo Mira, Stella Bounareli, Michał Stypułkowski, Konstantinos Vougioukas, Stavros Petridis, Maja Pantic
•
May 1, 2025
•
11
5
LLMs für das Ingenieurwesen: Modelle lehren, leistungsstarke Raketen zu entwerfen
LLMs for Engineering: Teaching Models to Design High Powered Rockets
Toby Simonds
•
Apr 27, 2025
•
11
1
TF1-EN-3M: Drei Millionen synthetische moralische Fabeln zur Schulung kleiner, offener Sprachmodelle
TF1-EN-3M: Three Million Synthetic Moral Fables for Training Small, Open Language Models
Mihai Nadas, Laura Diosan, Andrei Piscoran, Andreea Tomescu
•
Apr 29, 2025
•
10
2
AdaR1: Von Long-CoT zu Hybrid-CoT durch bi-level adaptive Optimierung des Denkprozesses
AdaR1: From Long-CoT to Hybrid-CoT via Bi-Level Adaptive Reasoning Optimization
Haotian Luo, Haiying He, Yibo Wang, Jinluan Yang, Rui Liu, Naiqiang Tan, Xiaochun Cao, Dacheng Tao, Li Shen
•
Apr 30, 2025
•
8
1
Räumliche Sprachübersetzung: Übersetzen über den Raum hinweg mit binauralen Hörgeräten
Spatial Speech Translation: Translating Across Space With Binaural Hearables
Tuochao Chen, Qirui Wang, Runlin He, Shyam Gollakota
•
Apr 25, 2025
•
7
1
MediAug: Erforschung visueller Augmentation in der medizinischen Bildgebung
MediAug: Exploring Visual Augmentation in Medical Imaging
Xuyin Qi, Zeyu Zhang, Canxuan Gang, Hao Zhang, Lei Zhang, Zhiwei Zhang, Yang Zhao
•
Apr 26, 2025
•
6
1
Fähigkeitsentdeckung für die Automatisierung von Software-Skripten durch Offline-Simulationen mit LLMs
Skill Discovery for Software Scripting Automation via Offline Simulations with LLMs
Paiheng Xu, Gang Wu, Xiang Chen, Tong Yu, Chang Xiao, Franck Dernoncourt, Tianyi Zhou, Wei Ai, Viswanathan Swaminathan
•
Apr 29, 2025
•
4
1
Ein robustes Multi-Objekt-Multi-Kamera-Tracking-System auf Basis tiefer neuronaler Netze für den städtischen Verkehrsmaßstab
A Robust Deep Networks based Multi-Object MultiCamera Tracking System for City Scale Traffic
Muhammad Imran Zaman, Usama Ijaz Bajwa, Gulshan Saleem, Rana Hammad Raza
•
May 1, 2025
•
2
1