ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
April 10th, 2025
WildGS-SLAM: Monokulare Gaussian Splatting SLAM in dynamischen Umgebungen
WildGS-SLAM: Monocular Gaussian Splatting SLAM in Dynamic Environments
Jianhao Zheng, Zihan Zhu, Valentin Bieri, Marc Pollefeys, Songyou Peng, Iro Armeni
•
Apr 4, 2025
•
10
3
Sind wir mit der objektzentrierten Lernforschung am Ende?
Are We Done with Object-Centric Learning?
Alexander Rubinstein, Ameya Prabhu, Matthias Bethge, Seong Joon Oh
•
Apr 9, 2025
•
6
2
DiTaiListener: Kontrollierbare Erzeugung hochwertiger Zuhörer-Videos mit Diffusionsmodellen
DiTaiListener: Controllable High Fidelity Listener Video Generation with Diffusion
Maksim Siniukov, Di Chang, Minh Tran, Hongkun Gong, Ashutosh Chaubey, Mohammad Soleymani
•
Apr 5, 2025
•
10
2
Fehlende Prämissen verstärken Grübeln: Verlieren Reasoning-Modelle ihre Fähigkeit zum kritischen Denken?
Missing Premise exacerbates Overthinking: Are Reasoning Models losing Critical Thinking Skill?
Chenrui Fan, Ming Li, Lichao Sun, Tianyi Zhou
•
Apr 9, 2025
•
39
3
OmniCaptioner: Ein Captioner, um sie alle zu beherrschen
OmniCaptioner: One Captioner to Rule Them All
Yiting Lu, Jiakang Yuan, Zhen Li, Shitian Zhao, Qi Qin, Xinyue Li, Le Zhuo, Licheng Wen, Dongyang Liu, Yuewen Cao, Xiangchao Yan, Xin Li, Botian Shi, Tao Chen, Zhibo Chen, Lei Bai, Bo Zhang, Peng Gao
•
Apr 9, 2025
•
20
2
RobustDexGrasp: Robuste geschickte Greifbewegung von allgemeinen Objekten basierend auf Einzelbildwahrnehmung
RobustDexGrasp: Robust Dexterous Grasping of General Objects from Single-view Perception
Hui Zhang, Zijian Wu, Linyi Huang, Sammy Christen, Jie Song
•
Apr 7, 2025
•
5
2
Ein einheitliches agentenbasiertes Framework zur Bewertung der bedingten Bildgenerierung
A Unified Agentic Framework for Evaluating Conditional Image Generation
Jifang Wang, Xue Yang, Longyue Wang, Zhenran Xu, Yiyu Wang, Yaowei Wang, Weihua Luo, Kaifu Zhang, Baotian Hu, Min Zhang
•
Apr 9, 2025
•
30
2
Schnelle kontrollierte Generierung aus Sprachmodellen mit adaptiv gewichtetem Rejection Sampling
Fast Controlled Generation from Language Models with Adaptive Weighted Rejection Sampling
Benjamin Lipkin, Benjamin LeBrun, Jacob Hoover Vigly, João Loula, David R. MacIver, Li Du, Jason Eisner, Ryan Cotterell, Vikash Mansinghka, Timothy J. O'Donnell, Alexander K. Lew, Tim Vieira
•
Apr 7, 2025
•
3
2
DDT: Entkoppelter Diffusions-Transformer
DDT: Decoupled Diffusion Transformer
Shuai Wang, Zhi Tian, Weilin Huang, Limin Wang
•
Apr 8, 2025
•
73
3
Selbststeuernde Sprachmodelle
Self-Steering Language Models
Gabriel Grand, Joshua B. Tenenbaum, Vikash K. Mansinghka, Alexander K. Lew, Jacob Andreas
•
Apr 9, 2025
•
18
2
Ein nüchterner Blick auf Fortschritte im Bereich des Sprachmodell-Denkens: Fallstricke und Wege zur Reproduzierbarkeit
A Sober Look at Progress in Language Model Reasoning: Pitfalls and Paths to Reproducibility
Andreas Hochlehnert, Hardik Bhatnagar, Vishaal Udandarao, Samuel Albanie, Ameya Prabhu, Matthias Bethge
•
Apr 9, 2025
•
21
3
Vorverarbeitung von Sprachmodellen zur Entdeckung diachroner Sprachveränderungen
Pretraining Language Models for Diachronic Linguistic Change Discovery
Elisabeth Fittschen, Sabrina Li, Tom Lippincott, Leshem Choshen, Craig Messner
•
Apr 7, 2025
•
6
2
GenDoP: Autoregressive Erzeugung von Kameratrajektorien als Director of Photography
GenDoP: Auto-regressive Camera Trajectory Generation as a Director of Photography
Mengchen Zhang, Tong Wu, Jing Tan, Ziwei Liu, Gordon Wetzstein, Dahua Lin
•
Apr 9, 2025
•
23
2
VideoChat-R1: Verbesserung der räumlich-zeitlichen Wahrnehmung durch Reinforcement-Feintuning
VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning
Xinhao Li, Ziang Yan, Desen Meng, Lu Dong, Xiangyu Zeng, Yinan He, Yali Wang, Yu Qiao, Yi Wang, Limin Wang
•
Apr 9, 2025
•
10
2
RuOpinionNE-2024: Extraktion von Meinungstupeln aus russischen Nachrichtentexten
RuOpinionNE-2024: Extraction of Opinion Tuples from Russian News Texts
Natalia Loukachevitch, Natalia Tkachenko, Anna Lapanitsyna, Mikhail Tikhomirov, Nicolay Rusnachenko
•
Apr 9, 2025
•
4
3
Alles im Video beschreiben: Fein abgestimmte objektzentrierte Beschreibung durch raumzeitliche multimodale Prompting
Caption Anything in Video: Fine-grained Object-centric Captioning via Spatiotemporal Multimodal Prompting
Yunlong Tang, Jing Bi, Chao Huang, Susan Liang, Daiki Shimada, Hang Hua, Yunzhong Xiao, Yizhi Song, Pinxin Liu, Mingqian Feng, Junjia Guo, Zhuo Liu, Luchuan Song, Ali Vosoughi, Jinxi He, Liu He, Zeliang Zhang, Jiebo Luo, Chenliang Xu
•
Apr 7, 2025
•
16
1
Masked Scene Modeling: Verringerung der Lücke zwischen überwachtem und selbstüberwachtem Lernen im 3D-Szenenverständnis
Masked Scene Modeling: Narrowing the Gap Between Supervised and Self-Supervised Learning in 3D Scene Understanding
Pedro Hermosilla, Christian Stippel, Leon Sick
•
Apr 9, 2025
•
9
2
FantasyTalking: Realistische Talking-Portrait-Generierung durch kohärente Bewegungsynthese
FantasyTalking: Realistic Talking Portrait Generation via Coherent Motion Synthesis
Mengchao Wang, Qiang Wang, Fan Jiang, Yaqi Fan, Yunpeng Zhang, Yonggang Qi, Kun Zhao, Mu Xu
•
Apr 7, 2025
•
35
3
OLMoTrace: Rückverfolgung von Sprachmodell-Ausgaben zu Billionen von Trainings-Tokens
OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens
Jiacheng Liu, Taylor Blanton, Yanai Elazar, Sewon Min, YenSung Chen, Arnavi Chheda-Kothary, Huy Tran, Byron Bischoff, Eric Marsh, Michael Schmitz, Cassidy Trier, Aaron Sarnat, Jenna James, Jon Borchardt, Bailey Kuehl, Evie Cheng, Karen Farley, Sruthi Sreeram, Taira Anderson, David Albright, Carissa Schoenick, Luca Soldaini, Dirk Groeneveld, Rock Yuren Pang, Pang Wei Koh, Noah A. Smith, Sophie Lebrecht, Yejin Choi, Hannaneh Hajishirzi, Ali Farhadi, Jesse Dodge
•
Apr 9, 2025
•
73
3
SkillWeaver: Web-Agenten können sich selbst verbessern, indem sie Fähigkeiten entdecken und verfeinern
SkillWeaver: Web Agents can Self-Improve by Discovering and Honing Skills
Boyuan Zheng, Michael Y. Fatemi, Xiaolong Jin, Zora Zhiruo Wang, Apurva Gandhi, Yueqi Song, Yu Gu, Jayanth Srinivasa, Gaowen Liu, Graham Neubig, Yu Su
•
Apr 9, 2025
•
0
1