ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
December 18th, 2024
Suchender: Auf dem Weg zur Codegenerierung mit Ausnahme-Sicherheit mithilfe des Frameworks für Zwischensprachen-Agenten
Seeker: Towards Exception Safety Code Generation with Intermediate Language Agents Framework
Xuanming Zhang, Yuxuan Chen, Yiming Zheng, Zhexin Zhang, Yuan Yuan, Minlie Huang
•
Dec 16, 2024
•
6
2
Sind Ihre LLMs in der Lage zu stabilem Schlussfolgern?
Are Your LLMs Capable of Stable Reasoning?
Junnan Liu, Hongwei Liu, Linchen Xiao, Ziyi Wang, Kuikun Liu, Songyang Gao, Wenwei Zhang, Songyang Zhang, Kai Chen
•
Dec 17, 2024
•
95
3
Komprimierte Gedankenkette: Effizientes Schlussfolgern durch dichte Repräsentationen
Compressed Chain of Thought: Efficient Reasoning Through Dense Representations
Jeffrey Cheng, Benjamin Van Durme
•
Dec 17, 2024
•
36
2
ZUCKER: Subjektgesteuerte Videoanpassung auf Null-Shot-Art und Weise
SUGAR: Subject-Driven Video Customization in a Zero-Shot Manner
Yufan Zhou, Ruiyi Zhang, Jiuxiang Gu, Nanxuan Zhao, Jing Shi, Tong Sun
•
Dec 13, 2024
•
5
2
VisDoM: Multi-Dokumenten-Fragen und Antworten mit visuell reichen Elementen unter Verwendung von multimodaler Retrieval-gestützter Generierung
VisDoM: Multi-Document QA with Visually Rich Elements Using Multimodal Retrieval-Augmented Generation
Manan Suri, Puneet Mathur, Franck Dernoncourt, Kanika Goswami, Ryan A. Rossi, Dinesh Manocha
•
Dec 14, 2024
•
15
2
Marigold-DC: Nullschuss-Monokulare Tiefenvervollständigung mit geführter Diffusion
Marigold-DC: Zero-Shot Monocular Depth Completion with Guided Diffusion
Massimiliano Viola, Kevin Qu, Nando Metzger, Bingxin Ke, Alexander Becker, Konrad Schindler, Anton Obukhov
•
Dec 18, 2024
•
7
2
Multidimensionale Einblicke: Benchmarking der Personalisierung in der realen Welt in großen multimodalen Modellen
Multi-Dimensional Insights: Benchmarking Real-World Personalization in Large Multimodal Models
YiFan Zhang, Shanglin Lei, Runqi Qiao, Zhuoma GongQue, Xiaoshuai Song, Guanting Dong, Qiuna Tan, Zhe Wei, Peiqing Yang, Ye Tian, Yadong Xue, Xiaofei Wang, Honggang Zhang
•
Dec 17, 2024
•
42
3
OmniEval: Ein omnidirektionaler und automatischer RAG-Evaluierungsbenchmark im Finanzbereich
OmniEval: An Omnidirectional and Automatic RAG Evaluation Benchmark in Financial Domain
Shuting Wang, Jiejun Tan, Zhicheng Dou, Ji-Rong Wen
•
Dec 17, 2024
•
42
2
Den Gashebel streicheln: Überprüfung der visuellen Token-Ausdünnung zur Beschleunigung von Bildsprachmodellen
Feather the Throttle: Revisiting Visual Token Pruning for Vision-Language Model Acceleration
Mark Endo, Xiaohan Wang, Serena Yeung-Levy
•
Dec 17, 2024
•
13
2
MIVE: Neues Design und Benchmark für die Bearbeitung von Mehrinstanzenvideos
MIVE: New Design and Benchmark for Multi-Instance Video Editing
Samuel Teodoro, Agus Gunawan, Soo Ye Kim, Jihyong Oh, Munchurl Kim
•
Dec 17, 2024
•
4
2
Wann sprechen, wann sich enthalten: Kontrastives Decodieren mit Enthaltung
When to Speak, When to Abstain: Contrastive Decoding with Abstention
Hyuhng Joon Kim, Youna Kim, Sang-goo Lee, Taeuk Kim
•
Dec 17, 2024
•
4
2
Vorschlags-Agent-Bewerter (PAB): Autonome Fähigkeitserkennung für Grundlagenmodell-Internetagenten
Proposer-Agent-Evaluator(PAE): Autonomous Skill Discovery For Foundation Model Internet Agents
Yifei Zhou, Qianlan Yang, Kaixiang Lin, Min Bai, Xiong Zhou, Yu-Xiong Wang, Sergey Levine, Erran Li
•
Dec 17, 2024
•
12
2
Entstehung von Abstraktionen: Konzeptkodierungs- und Dekodierungsmechanismus für kontextbezogenes Lernen in Transformern
Emergence of Abstractions: Concept Encoding and Decoding Mechanism for In-Context Learning in Transformers
Seungwook Han, Jinyeop Song, Jeff Gore, Pulkit Agrawal
•
Dec 16, 2024
•
15
2