ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
March 31st, 2025
Denken, bevor empfohlen wird: Die latente Denkfähigkeit für sequenzielle Empfehlungen freisetzen
Think Before Recommend: Unleashing the Latent Reasoning Power for Sequential Recommendation
Jiakai Tang, Sunhao Dai, Teng Shi, Jun Xu, Xu Chen, Wen Chen, Wu Jian, Yuning Jiang
•
Mar 28, 2025
•
35
2
Perzeptuell präzise 3D-Talking-Head-Generierung: Neue Definitionen, Sprach-Mesh-Repräsentation und Bewertungsmetriken
Perceptually Accurate 3D Talking Head Generation: New Definitions, Speech-Mesh Representation, and Evaluation Metrics
Lee Chae-Yeon, Oh Hyun-Bin, Han EunGi, Kim Sung-Bin, Suekyeong Nam, Tae-Hyun Oh
•
Mar 26, 2025
•
22
3
MedAgent-Pro: Auf dem Weg zu einer multimodalen evidenzbasierten medizinischen Diagnose durch einen agentenbasierten Workflow für logisches Schlussfolgern
MedAgent-Pro: Towards Multi-modal Evidence-based Medical Diagnosis via Reasoning Agentic Workflow
Ziyue Wang, Junde Wu, Chang Han Low, Yueming Jin
•
Mar 21, 2025
•
6
2
ORIGEN: Zero-Shot 3D-Orientierungsverankerung in der Text-zu-Bild-Generierung
ORIGEN: Zero-Shot 3D Orientation Grounding in Text-to-Image Generation
Yunhong Min, Daehyeon Choi, Kyeongmin Yeo, Jihyun Lee, Minhyuk Sung
•
Mar 28, 2025
•
24
3
Untersuchung von Datenskalierungstrends und -effekten beim Reinforcement Learning aus menschlichem Feedback
Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback
Wei Shen, Guanlin Liu, Zheng Wu, Ruofei Zhu, Qingping Yang, Chao Xin, Yu Yue, Lin Yan
•
Mar 28, 2025
•
44
2
PHYSIK: Evaluierung von Foundation Models bei der Lösung universitätsrelevanter Physikprobleme
PHYSICS: Benchmarking Foundation Models on University-Level Physics Problem Solving
Kaiyue Feng, Yilun Zhao, Yixin Liu, Tianyu Yang, Chen Zhao, John Sous, Arman Cohan
•
Mar 26, 2025
•
17
2
Rekonstruktion von Menschen mit einem biomechanisch präzisen Skelett
Reconstructing Humans with a Biomechanically Accurate Skeleton
Yan Xia, Xiaowei Zhou, Etienne Vouga, Qixing Huang, Georgios Pavlakos
•
Mar 27, 2025
•
9
2
Eine Übersicht über effizientes Schließen bei großen Schließmodellen: Sprache, Multimodalität und darüber hinaus
A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond
Xiaoye Qu, Yafu Li, Zhaochen Su, Weigao Sun, Jianhao Yan, Dongrui Liu, Ganqu Cui, Daizong Liu, Shuxian Liang, Junxian He, Peng Li, Wei Wei, Jing Shao, Chaochao Lu, Yue Zhang, Xian-Sheng Hua, Bowen Zhou, Yu Cheng
•
Mar 27, 2025
•
39
4
Ihr ViT ist heimlich ein Bildsegmentierungsmodell.
Your ViT is Secretly an Image Segmentation Model
Tommie Kerssies, Niccolò Cavagnero, Alexander Hermans, Narges Norouzi, Giuseppe Averta, Bastian Leibe, Gijs Dubbelman, Daan de Geus
•
Mar 24, 2025
•
21
2
Hi3DGen: Hochauflösende 3D-Geometrieerzeugung aus Bildern durch Normalenbrückenschaltung
Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging
Chongjie Ye, Yushuang Wu, Ziteng Lu, Jiahao Chang, Xiaoyang Guo, Jiaqing Zhou, Hao Zhao, Xiaoguang Han
•
Mar 28, 2025
•
11
2
Herausforderungen und Wege zu KI für Software Engineering
Challenges and Paths Towards AI for Software Engineering
Alex Gu, Naman Jain, Wen-Ding Li, Manish Shetty, Yijia Shao, Ziyang Li, Diyi Yang, Kevin Ellis, Koushik Sen, Armando Solar-Lezama
•
Mar 28, 2025
•
4
2
OThink-MR1: Förderung multimodaler generalisierter Denkfähigkeiten durch dynamisches bestärkendes Lernen
OThink-MR1: Stimulating multimodal generalized reasoning capabilities via dynamic reinforcement learning
Zhiyuan Liu, Yuting Zhang, Feng Liu, Changwang Zhang, Ying Sun, Jun Wang
•
Mar 20, 2025
•
26
3
AdaptiVocab: Steigerung der Effizienz von LLMs in spezialisierten Domänen durch leichte Vokabularanpassung
AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation
Itay Nakash, Nitay Calderon, Eyal Ben David, Elad Hoffer, Roi Reichart
•
Mar 25, 2025
•
75
2
SparseFlex: Hochauflösende und beliebig-topologische 3D-Formmodellierung
SparseFlex: High-Resolution and Arbitrary-Topology 3D Shape Modeling
Xianglong He, Zi-Xin Zou, Chia-Hao Chen, Yuan-Chen Guo, Ding Liang, Chun Yuan, Wanli Ouyang, Yan-Pei Cao, Yangguang Li
•
Mar 27, 2025
•
9
2
Eine verfeinerte Analyse massiver Aktivierungen in großen Sprachmodellen
A Refined Analysis of Massive Activations in LLMs
Louis Owen, Nilabhra Roy Chowdhury, Abhay Kumar, Fabian Güra
•
Mar 28, 2025
•
14
3
Zero4D: Trainingsfreie 4D-Videogenerierung aus einem einzelnen Video mithilfe eines verfügbaren Video-Diffusionsmodells
Zero4D: Training-Free 4D Video Generation From Single Video Using Off-the-Shelf Video Diffusion Model
Jangho Park, Taesung Kwon, Jong Chul Ye
•
Mar 28, 2025
•
18
2
Segmentierung beliebiger Bewegungen in Videos
Segment Any Motion in Videos
Nan Huang, Wenzhao Zheng, Chenfeng Xu, Kurt Keutzer, Shanghang Zhang, Angjoo Kanazawa, Qianqian Wang
•
Mar 28, 2025
•
17
2
ReFeed: Mehrdimensionale Zusammenfassungsverfeinerung mit reflektivem Denken auf Basis von Feedback
ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback
Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song
•
Mar 27, 2025
•
20
3
SWI: Sprechen mit Absicht in großen Sprachmodellen
SWI: Speaking with Intent in Large Language Models
Yuwei Yin, EunJeong Hwang, Giuseppe Carenini
•
Mar 27, 2025
•
2
2
Free4D: Generierung von 4D-Szenen ohne Anpassung mit räumlich-zeitlicher Konsistenz
Free4D: Tuning-free 4D Scene Generation with Spatial-Temporal Consistency
Tianqi Liu, Zihao Huang, Zhaoxi Chen, Guangcong Wang, Shoukang Hu, Liao Shen, Huiqiang Sun, Zhiguo Cao, Wei Li, Ziwei Liu
•
Mar 26, 2025
•
21
2
X^{2}-Gaussian: 4D Radiative Gaußsche Splatting für kontinuierliche tomografische Rekonstruktion
X^{2}-Gaussian: 4D Radiative Gaussian Splatting for Continuous-time Tomographic Reconstruction
Weihao Yu, Yuanhao Cai, Ruyi Zha, Zhiwen Fan, Chenxin Li, Yixuan Yuan
•
Mar 27, 2025
•
3
2
4D-Bench: Benchmarking multimodaler großer Sprachmodelle für das 4D-Objektverständnis
4D-Bench: Benchmarking Multi-modal Large Language Models for 4D Object Understanding
Wenxuan Zhu, Bing Li, Cheng Zheng, Jinjie Mai, Jun Chen, Letian Jiang, Abdullah Hamdi, Sara Rojas Martinez, Chia-Wen Lin, Mohamed Elhoseiny, Bernard Ghanem
•
Mar 22, 2025
•
8
3
Über große multimodale Modelle als Open-World-Bildklassifikatoren
On Large Multimodal Models as Open-World Image Classifiers
Alessandro Conti, Massimiliano Mancini, Enrico Fini, Yiming Wang, Paolo Rota, Elisa Ricci
•
Mar 27, 2025
•
5
2