ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
May 14th, 2025
MiniMax-Speech: Intrinsisches Zero-Shot Text-to-Speech mit einem lernfähigen Sprecher-Encoder
MiniMax-Speech: Intrinsic Zero-Shot Text-to-Speech with a Learnable Speaker Encoder
Bowen Zhang, Congchao Guo, Geng Yang, Hang Yu, Haozhe Zhang, Heidi Lei, Jialong Mai, Junjie Yan, Kaiyue Yang, Mingqi Yang, Peikai Huang, Ruiyang Jin, Sitan Jiang, Weihua Cheng, Yawei Li, Yichen Xiao, Yiying Zhou, Yongmao Zhang, Yuan Lu, Yucen He
•
May 12, 2025
•
100
3
Schnelle Text-zu-Audio-Generierung mit adversariellem Nach-Training
Fast Text-to-Audio Generation with Adversarial Post-Training
Zachary Novack, Zach Evans, Zack Zukowski, Josiah Taylor, CJ Carr, Julian Parker, Adnan Al-Sinan, Gian Marco Iodice, Julian McAuley, Taylor Berg-Kirkpatrick, Jordi Pons
•
May 13, 2025
•
13
2
Aya Vision: Die Grenzen der mehrsprachigen Multimodalität vorantreiben
Aya Vision: Advancing the Frontier of Multilingual Multimodality
Saurabh Dash, Yiyang Nan, John Dang, Arash Ahmadian, Shivalika Singh, Madeline Smith, Bharat Venkitesh, Vlad Shmyhlo, Viraat Aryabumi, Walter Beller-Morales, Jeremy Pekmez, Jason Ozuzu, Pierre Richemond, Acyr Locatelli, Nick Frosst, Phil Blunsom, Aidan Gomez, Ivan Zhang, Marzieh Fadaee, Manoj Govindassamy, Sudip Roy, Matthias Gallé, Beyza Ermis, Ahmet Üstün, Sara Hooker
•
May 13, 2025
•
7
2
AM-Thinking-v1: Vorantreiben der Grenzen des logischen Denkens im 32B-Maßstab
AM-Thinking-v1: Advancing the Frontier of Reasoning at 32B Scale
Yunjie Ji, Xiaoyu Tian, Sitong Zhao, Haotian Wang, Shuaiting Chen, Yiping Peng, Han Zhao, Xiangang Li
•
May 13, 2025
•
7
2
Ein mehrdimensionales Rahmenwerk zur Bewertung und Verbesserung der Befolgung von Anweisungen in großen Sprachmodellen
A Multi-Dimensional Constraint Framework for Evaluating and Improving Instruction Following in Large Language Models
Junjie Ye, Caishuang Huang, Zhuohan Chen, Wenjie Fu, Chenyuan Yang, Leyi Yang, Yilong Wu, Peng Wang, Meng Zhou, Xiaolong Yang, Tao Gui, Qi Zhang, Zhongchao Shi, Jianping Fan, Xuanjing Huang
•
May 12, 2025
•
7
2
Messung der Allgemeinen Intelligenz mit generierten Spielen
Measuring General Intelligence with Generated Games
Vivek Verma, David Huang, William Chen, Dan Klein, Nicholas Tomlin
•
May 12, 2025
•
6
2
Bring Reason to Vision: Wahrnehmung und logisches Denken durch Modellzusammenführung verstehen
Bring Reason to Vision: Understanding Perception and Reasoning through Model Merging
Shiqi Chen, Jinghan Zhang, Tongyao Zhu, Wei Liu, Siyang Gao, Miao Xiong, Manling Li, Junxian He
•
May 8, 2025
•
6
2
Fortschritte bei arabischen Reverse-Wörterbuchsystemen: Ein Transformer-basierter Ansatz mit Richtlinien zur Datensatzerstellung
Advancing Arabic Reverse Dictionary Systems: A Transformer-Based Approach with Dataset Construction Guidelines
Serry Sibaee, Samar Ahmed, Abdullah Al Harbi, Omer Nacar, Adel Ammar, Yasser Habashi, Wadii Boulila
•
Apr 30, 2025
•
5
2
TRAIL: Trace Reasoning und Agentic Issue Localization
TRAIL: Trace Reasoning and Agentic Issue Localization
Darshan Deshpande, Varun Gangal, Hersh Mehta, Jitin Krishnan, Anand Kannappan, Rebecca Qian
•
May 13, 2025
•
4
2
Memorierungs-Kompressions-Zyklen verbessern die Generalisierung.
Memorization-Compression Cycles Improve Generalization
Fangyuan Yu
•
May 13, 2025
•
3
2
SkillFormer: Vereinheitlichtes Multi-View-Videoverständnis zur Kompetenzschätzung
SkillFormer: Unified Multi-View Video Understanding for Proficiency Estimation
Edoardo Bianchi, Antonio Liotta
•
May 13, 2025
•
3
2
Optimierung von Retrieval-Augmented Generation: Analyse der Auswirkungen von Hyperparametern auf Leistung und Effizienz
Optimizing Retrieval-Augmented Generation: Analysis of Hyperparameter Impact on Performance and Efficiency
Adel Ammar, Anis Koubaa, Omer Nacar, Wadii Boulila
•
May 13, 2025
•
2
2
NavDP: Lernen einer Sim-to-Real-Navigationsdiffusionspolitik mit privilegierter Informationsführung
NavDP: Learning Sim-to-Real Navigation Diffusion Policy with Privileged Information Guidance
Wenzhe Cai, Jiaqi Peng, Yuqiang Yang, Yujian Zhang, Meng Wei, Hanqing Wang, Yilun Chen, Tai Wang, Jiangmiao Pang
•
May 13, 2025
•
1
2
ViMRHP: Ein vietnamesischer Benchmark-Datensatz für die multimodale Vorhersage der Nützlichkeit von Bewertungen durch kollaborative Annotation von Mensch und KI
ViMRHP: A Vietnamese Benchmark Dataset for Multimodal Review Helpfulness Prediction via Human-AI Collaborative Annotation
Truc Mai-Thanh Nguyen, Dat Minh Nguyen, Son T. Luu, Kiet Van Nguyen
•
May 12, 2025
•
1
2
Tests als Prompt: Ein Testgetriebener Entwicklungs-Benchmark für die Codegenerierung mit LLMs
Tests as Prompt: A Test-Driven-Development Benchmark for LLM Code Generation
Yi Cui
•
May 13, 2025
•
0
1