ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
February 25th, 2025
Untersuchung des Einflusses von Quantisierungsmethoden auf die Sicherheit und Zuverlässigkeit großer Sprachmodelle
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models
Artyom Kharinaev, Viktor Moskvoretskii, Egor Shvetsov, Kseniia Studenikina, Bykov Mikhail, Evgeny Burnaev
•
Feb 18, 2025
•
7
2
Reflexives Planen: Vision-Sprach-Modelle für mehrstufige Langzeit-Roboter-Manipulation
Reflective Planning: Vision-Language Models for Multi-Stage Long-Horizon Robotic Manipulation
Yunhai Feng, Jiaming Han, Zhuoran Yang, Xiangyu Yue, Sergey Levine, Jianlan Luo
•
Feb 23, 2025
•
13
2
VideoGrain: Modulation von Raum-Zeit-Aufmerksamkeit für mehrkörnige Videobearbeitung
VideoGrain: Modulating Space-Time Attention for Multi-grained Video Editing
Xiangpeng Yang, Linchao Zhu, Hehe Fan, Yi Yang
•
Feb 24, 2025
•
79
5
Stable-SPAM: Wie man stabiler in 4-Bit trainiert als mit 16-Bit Adam
Stable-SPAM: How to Train in 4-Bit More Stably than 16-Bit Adam
Tianjin Huang, Haotian Hu, Zhenyu Zhang, Gaojie Jin, Xiang Li, Li Shen, Tianlong Chen, Lu Liu, Qingsong Wen, Zhangyang Wang, Shiwei Liu
•
Feb 24, 2025
•
18
2
Machen wir LoRA wieder großartig: Steigerung von LoRA mit adaptiven Singulärwerten und Optimierung der Mischung von Experten-Ausrichtung.
Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment
Chenghao Fan, Zhenyi Lu, Sichen Liu, Xiaoye Qu, Wei Wei, Chengfeng Gu, Yu Cheng
•
Feb 24, 2025
•
29
4
Mobile-Agent-V: Lernen der Bedienung mobiler Geräte durch video-geführte Multi-Agenten-Zusammenarbeit
Mobile-Agent-V: Learning Mobile Device Operation Through Video-Guided Multi-Agent Collaboration
Junyang Wang, Haiyang Xu, Xi Zhang, Ming Yan, Ji Zhang, Fei Huang, Jitao Sang
•
Feb 24, 2025
•
13
2
X-Tänzer: Generierung von ausdrucksstarker Musik zu menschlichen Tanzvideos
X-Dancer: Expressive Music to Human Dance Video Generation
Zeyuan Chen, Hongyi Xu, Guoxian Song, You Xie, Chenxu Zhang, Xin Chen, Chao Wang, Di Chang, Linjie Luo
•
Feb 24, 2025
•
11
3
InductionBench: LLMs versagen in der einfachsten Komplexitätsklasse.
InductionBench: LLMs Fail in the Simplest Complexity Class
Wenyue Hua, Tyler Wong, Sun Fei, Liangming Pan, Adam Jardine, William Yang Wang
•
Feb 20, 2025
•
7
2
Linguistische Verallgemeinerbarkeit der Skalierung zur Testzeit in mathematischem Denken
Linguistic Generalizability of Test-Time Scaling in Mathematical Reasoning
Guijin Son, Jiwoo Hong, Hyunwoo Ko, James Thorne
•
Feb 24, 2025
•
26
2
MutaGReP: Ausführungsfreie Repository-Verankerte Planungssuche für Code-Verwendung
MutaGReP: Execution-Free Repository-Grounded Plan Search for Code-Use
Zaid Khan, Ali Farhadi, Ranjay Krishna, Luca Weihs, Mohit Bansal, Tanmay Gupta
•
Feb 21, 2025
•
5
2
Schlagartig: Training eines Sprachmodells an einem GPU innerhalb eines Tages
Slamming: Training a Speech Language Model on One GPU in a Day
Gallil Maimon, Avishai Elmakies, Yossi Adi
•
Feb 19, 2025
•
69
2
MONSTER: Monash Skalierbares Zeitreihen-Evaluierungs-Repository
MONSTER: Monash Scalable Time Series Evaluation Repository
Angus Dempster, Navid Mohammadi Foumani, Chang Wei Tan, Lynn Miller, Amish Mishra, Mahsa Salehi, Charlotte Pelletier, Daniel F. Schmidt, Geoffrey I. Webb
•
Feb 21, 2025
•
3
2
Vergleich von zeitlichem Denken und Abstimmung über chinesische Dynastien
Benchmarking Temporal Reasoning and Alignment Across Chinese Dynasties
Zhenglin Wang, Jialong Wu, Pengfei LI, Yong Jiang, Deyu Zhou
•
Feb 24, 2025
•
8
4
Achte auf die Lücke! Statische und interaktive Bewertungen großer Audio-Modelle
Mind the Gap! Static and Interactive Evaluations of Large Audio Models
Minzhi Li, William Barr Held, Michael J Ryan, Kunat Pipatanakul, Potsawee Manakul, Hao Zhu, Diyi Yang
•
Feb 21, 2025
•
4
2
Über die Veröffentlichung hinaus: Zugriffsüberlegungen für generative KI-Systeme
Beyond Release: Access Considerations for Generative AI Systems
Irene Solaiman, Rishi Bommasani, Dan Hendrycks, Ariel Herbert-Voss, Yacine Jernite, Aviya Skowron, Andrew Trask
•
Feb 23, 2025
•
16
4
Die Schlange in der Brownschen Kugel.
The snake in the Brownian sphere
Omer Angel, Emmanuel Jacob, Brett Kolesnik, Grégory Miermont
•
Feb 18, 2025
•
2
2
TAG: Ein dezentralisiertes Framework für hierarchisches Multi-Agenten-Verstärkungslernen
TAG: A Decentralized Framework for Multi-Agent Hierarchical Reinforcement Learning
Giuseppe Paolo, Abdelhakim Benechehab, Hamza Cherkaoui, Albert Thomas, Balázs Kégl
•
Feb 21, 2025
•
9
2
CodeCriticBench: Ein ganzheitlicher Code-Kritik-Benchmark für große Sprachmodelle
CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models
Alexander Zhang, Marcus Dong, Jiaheng Liu, Wei Zhang, Yejie Wang, Jian Yang, Ge Zhang, Tianyu Liu, Zhongyuan Peng, Yingshui Tan, Yuanxing Zhang, Zhexu Wang, Weixun Wang, Yancheng He, Ken Deng, Wangchunshu Zhou, Wenhao Huang, Zhaoxiang Zhang
•
Feb 23, 2025
•
27
3
Pandora3D: Ein umfassendes Framework für die hochwertige Generierung von 3D-Formen und Texturen
Pandora3D: A Comprehensive Framework for High-Quality 3D Shape and Texture Generation
Jiayu Yang, Taizhang Shang, Weixuan Sun, Xibin Song, Ziang Cheng, Senbo Wang, Shenzhou Chen, Weizhe Liu, Hongdong Li, Pan Ji
•
Feb 20, 2025
•
6
2
DICEPTION: Ein generalistisches Diffusionsmodell für visuelle Wahrnehmungsaufgaben
DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks
Canyu Zhao, Mingyu Liu, Huanyi Zheng, Muzhi Zhu, Zhiyue Zhao, Hao Chen, Tong He, Chunhua Shen
•
Feb 24, 2025
•
53
3
Frühzeitiger Abbruch und Sofortige Vertrauensschätzung der Übersetzungsqualität
Early-Exit and Instant Confidence Translation Quality Estimation
Vilém Zouhar, Maike Züfle, Beni Egressy, Julius Cheng, Jan Niehues
•
Feb 20, 2025
•
4
2
MegaLoc: Eine Abfrage, sie alle zu finden
MegaLoc: One Retrieval to Place Them All
Gabriele Berton, Carlo Masone
•
Feb 24, 2025
•
3
2
Diagnose der COVID-19-Schwere anhand von Brust-Röntgenbildern mit ViT- und CNN-Architekturen.
Diagnosing COVID-19 Severity from Chest X-Ray Images Using ViT and CNN Architectures
Luis Lara, Lucia Eve Berger, Rajesh Raju, Shawn Whitfield
•
Feb 23, 2025
•
2
2
Multimodale Inkonsistenzbegründung (MMIR): Ein neuer Maßstab für multimodale Begründungsmodelle
Multimodal Inconsistency Reasoning (MMIR): A New Benchmark for Multimodal Reasoning Models
Qianqi Yan, Yue Fan, Hongquan Li, Shan Jiang, Yang Zhao, Xinze Guan, Ching-Chen Kuo, Xin Eric Wang
•
Feb 22, 2025
•
18
2
Prognose des Wachstums von Open-Weight KI-Modellen auf Hugging Face
Forecasting Open-Weight AI Model Growth on Hugging Face
Kushal Raj Bhandari, Pin-Yu Chen, Jianxi Gao
•
Feb 21, 2025
•
10
3
RIFLEx: Ein kostenloser Mittagstisch für Längenextrapolation in Video-Transformern
RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers
Min Zhao, Guande He, Yixiao Chen, Hongzhou Zhu, Chongxuan Li, Jun Zhu
•
Feb 21, 2025
•
20
3
GCC: Generative Farbkonstanz durch Diffusion eines Farbprüfcharts
GCC: Generative Color Constancy via Diffusing a Color Checker
Chen-Wei Chang, Cheng-De Fan, Chia-Che Chang, Yi-Chen Lo, Yu-Chee Tseng, Jiun-Long Huang, Yu-Lun Liu
•
Feb 24, 2025
•
28
2
Audio-FLAN: Eine Vorabveröffentlichung
Audio-FLAN: A Preliminary Release
Liumeng Xue, Ziya Zhou, Jiahao Pan, Zixuan Li, Shuai Fan, Yinghao Ma, Sitong Cheng, Dongchao Yang, Haohan Guo, Yujia Xiao, Xinsheng Wang, Zixuan Shen, Chuanbo Zhu, Xinshen Zhang, Tianchi Liu, Ruibin Yuan, Zeyue Tian, Haohe Liu, Emmanouil Benetos, Ge Zhang, Yike Guo, Wei Xue
•
Feb 23, 2025
•
37
2
Selbstlernendes agentisches Verständnis langer Kontexte
Self-Taught Agentic Long Context Understanding
Yufan Zhuang, Xiaodong Yu, Jialian Wu, Ximeng Sun, Ze Wang, Jiang Liu, Yusheng Su, Jingbo Shang, Zicheng Liu, Emad Barsoum
•
Feb 21, 2025
•
3
2
M3-AGIQA: Multimodale, mehrstufige, multifaktorielle KI-generierte Bildqualitätsbewertung
M3-AGIQA: Multimodal, Multi-Round, Multi-Aspect AI-Generated Image Quality Assessment
Chuan Cui, Kejiang Chen, Zhihua Wei, Wen Shen, Weiming Zhang, Nenghai Yu
•
Feb 21, 2025
•
2
2
So sprach das lange Kontext große Sprachmodell.
Thus Spake Long-Context Large Language Model
Xiaoran Liu, Ruixiao Li, Mianqiu Huang, Zhigeng Liu, Yuerong Song, Qipeng Guo, Siyang He, Qiqi Wang, Linlin Li, Qun Liu, Yaqian Zhou, Xuanjing Huang, Xipeng Qiu
•
Feb 24, 2025
•
73
6
Verankerte überzeugende Spracherzeugung für automatisiertes Marketing
Grounded Persuasive Language Generation for Automated Marketing
Jibang Wu, Chenghao Yang, Simon Mahns, Chaoqi Wang, Hao Zhu, Fei Fang, Haifeng Xu
•
Feb 24, 2025
•
12
3
Können Community-Notizen professionelle Faktenprüfer ersetzen?
Can Community Notes Replace Professional Fact-Checkers?
Nadav Borenstein, Greta Warren, Desmond Elliott, Isabelle Augenstein
•
Feb 19, 2025
•
6
2