ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
March 3rd, 2025
DexGraspVLA: Ein Vision-Sprache-Handlung-Framework für allgemeines geschicktes Greifen
DexGraspVLA: A Vision-Language-Action Framework Towards General Dexterous Grasping
Yifan Zhong, Xuchuan Huang, Ruochong Li, Ceyao Zhang, Yitao Liang, Yaodong Yang, Yuanpei Chen
•
Feb 28, 2025
•
9
2
DeepSolution: Verbesserung des Entwurfs komplexer technischer Lösungen durch baumbasierte Exploration und bipunktionales Denken
DeepSolution: Boosting Complex Engineering Solution Design via Tree-based Exploration and Bi-point Thinking
Zhuoqun Li, Haiyang Yu, Xuanang Chen, Hongyu Lin, Yaojie Lu, Fei Huang, Xianpei Han, Yongbin Li, Le Sun
•
Feb 28, 2025
•
40
4
SoS1: O1 und R1-ähnliche Reasoning-LLMs sind Summe-der-Quadrate-Löser
SoS1: O1 and R1-Like Reasoning LLMs are Sum-of-Square Solvers
Kechen Li, Wenqi Zhu, Coralia Cartis, Tianbo Ji, Shiwei Liu
•
Feb 27, 2025
•
22
2
LiteASR: Effiziente automatische Spracherkennung mit Niedrigrang-Approximation
LiteASR: Efficient Automatic Speech Recognition with Low-Rank Approximation
Keisuke Kamahori, Jungo Kasai, Noriyuki Kojima, Baris Kasikci
•
Feb 27, 2025
•
13
2
Präferenzlernen erschließt die psychologische Beratungsfähigkeiten von LLMs
Preference Learning Unlocks LLMs' Psycho-Counseling Skills
Mian Zhang, Shaun M. Eack, Zhiyu Zoey Chen
•
Feb 27, 2025
•
7
2
Sag mir warum: Visuelle Basismodelle als selbst-erklärende Klassifikatoren
Tell me why: Visual foundation models as self-explainable classifiers
Hugues Turbé, Mina Bjelogrlic, Gianmarco Mengaldo, Christian Lovis
•
Feb 26, 2025
•
11
2
Kette der Entwürfe: Schneller denken durch weniger Schreiben
Chain of Draft: Thinking Faster by Writing Less
Silei Xu, Wenhao Xie, Lingxiao Zhao, Pengcheng He
•
Feb 25, 2025
•
48
4
Optimale Gehirn-Apoptose
Optimal Brain Apoptosis
Mingyuan Sun, Zheng Fang, Jiaxu Wang, Junjie Jiang, Delei Kong, Chenming Hu, Yuetong Fang, Renjing Xu
•
Feb 25, 2025
•
10
2
Wie weit können wir mit ImageNet bei der Text-zu-Bild-Generierung kommen?
How far can we go with ImageNet for Text-to-Image generation?
L. Degeorge, A. Ghosh, N. Dufour, D. Picard, V. Kalogeiton
•
Feb 28, 2025
•
26
2
LettuceDetect: Ein Framework zur Halluzinationserkennung für RAG-Anwendungen
LettuceDetect: A Hallucination Detection Framework for RAG Applications
Ádám Kovács, Gábor Recski
•
Feb 24, 2025
•
11
2
HAIC: Verbesserung des Verständnisses und der Generierung menschlicher Handlungen durch bessere Beschriftungen für multimodale Large Language Models
HAIC: Improving Human Action Understanding and Generation with Better Captions for Multi-modal Large Language Models
Xiao Wang, Jingyun Hua, Weihong Lin, Yuanxing Zhang, Fuzheng Zhang, Jianlong Wu, Di Zhang, Liqiang Nie
•
Feb 28, 2025
•
2
2
Prädiktive Datenauswahl: Die Daten, die vorhersagen, sind die Daten, die lehren
Predictive Data Selection: The Data That Predicts Is the Data That Teaches
Kashun Shum, Yuzhen Huang, Hongjian Zou, Ding Qi, Yixuan Liao, Xiaoxin Chen, Qian Liu, Junxian He
•
Mar 2, 2025
•
57
2
MIGE: Ein einheitliches Framework für multimodale, instruktionsbasierte Bildgenerierung und -bearbeitung
MIGE: A Unified Framework for Multimodal Instruction-Based Image Generation and Editing
Xueyun Tian, Wei Li, Bingbing Xu, Yige Yuan, Yuanzhuo Wang, Huawei Shen
•
Feb 28, 2025
•
5
2
Mehrschrittige Codegenerierung durch Einzelschritt-Belohnungen
Multi-Turn Code Generation Through Single-Step Rewards
Arnav Kumar Jain, Gonzalo Gonzalez-Pumariega, Wayne Chen, Alexander M Rush, Wenting Zhao, Sanjiban Choudhury
•
Feb 27, 2025
•
31
2
TeleRAG: Effiziente Inferenz mit Retrieval-Augmented Generation durch Lookahead-Retrieval
TeleRAG: Efficient Retrieval-Augmented Generation Inference with Lookahead Retrieval
Chien-Yu Lin, Keisuke Kamahori, Yiyu Liu, Xiaoxiang Shi, Madhav Kashyap, Yile Gu, Rulin Shao, Zihao Ye, Kan Zhu, Stephanie Wang, Arvind Krishnamurthy, Rohan Kadekodi, Luis Ceze, Baris Kasikci
•
Feb 28, 2025
•
11
2
EgoNormia: Benchmarking des Verständnisses physischer sozialer Normen
EgoNormia: Benchmarking Physical Social Norm Understanding
MohammadHossein Rezaei, Yicheng Fu, Phil Cuvin, Caleb Ziems, Yanzhe Zhang, Hao Zhu, Diyi Yang
•
Feb 27, 2025
•
5
2
ViDoRAG: Visuelles Dokumenten-Retrieval-Augmentierte Generierung durch dynamische iterative Reasoning-Agenten
ViDoRAG: Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents
Qiuchen Wang, Ruixue Ding, Zehui Chen, Weiqi Wu, Shihang Wang, Pengjun Xie, Feng Zhao
•
Feb 25, 2025
•
20
2
Sim-to-Real Reinforcement Learning für visuell basierte geschickte Manipulation bei Humanoiden
Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids
Toru Lin, Kartik Sachdev, Linxi Fan, Jitendra Malik, Yuke Zhu
•
Feb 27, 2025
•
16
2