ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
September 13th, 2024
DSBench: Wie weit sind Datenwissenschaftsagenten davon entfernt, Datenwissenschaftsexperten zu werden?
DSBench: How Far Are Data Science Agents to Becoming Data Science Experts?
Liqiang Jing, Zhehui Huang, Xiaoyang Wang, Wenlin Yao, Wenhao Yu, Kaixin Ma, Hongming Zhang, Xinya Du, Dong Yu
•
Sep 12, 2024
•
69
5
Windows Agent Arena: Evaluierung von Multi-Modalen Betriebssystem-Agenten im großen Maßstab
Windows Agent Arena: Evaluating Multi-Modal OS Agents at Scale
Rogerio Bonatti, Dan Zhao, Francesco Bonacci, Dillon Dupont, Sara Abdali, Yinheng Li, Justin Wagle, Kazuhito Koishida, Arthur Bucker, Lawrence Jang, Zack Hui
•
Sep 12, 2024
•
48
2
Können LLMs neue Forschungsideen generieren? Eine groß angelegte Studie mit über 100 NLP-Forschern.
Can LLMs Generate Novel Research Ideas? A Large-Scale Human Study with 100+ NLP Researchers
Chenglei Si, Diyi Yang, Tatsunori Hashimoto
•
Sep 6, 2024
•
48
3
IFAdapter: Instanzmerkmalssteuerung für die verankerte Text-zu-Bild-Generierung
IFAdapter: Instance Feature Control for Grounded Text-to-Image Generation
Yinwei Wu, Xianpan Zhou, Bing Ma, Xuefeng Su, Kai Ma, Xinchao Wang
•
Sep 12, 2024
•
23
2
Source2Synth: Generierung und Zusammenstellung synthetischer Daten basierend auf realen Datenquellen
Source2Synth: Synthetic Data Generation and Curation Grounded in Real Data Sources
Alisia Lupidi, Carlos Gemmell, Nicola Cancedda, Jane Dwivedi-Yu, Jason Weston, Jakob Foerster, Roberta Raileanu, Maria Lomeli
•
Sep 12, 2024
•
21
2
TextBoost: Auf dem Weg zur Personalisierung von Text-zu-Bild-Modellen mit nur einem Schritt durch Feinabstimmung des Textencoders
TextBoost: Towards One-Shot Personalization of Text-to-Image Models via Fine-tuning Text Encoder
NaHyeon Park, Kunhee Kim, Hyunjung Shim
•
Sep 12, 2024
•
16
4
DreamHOI: Subjektgesteuerte Generierung von 3D-Mensch-Objekt-Interaktionen mit Diffusionsprioritäten
DreamHOI: Subject-Driven Generation of 3D Human-Object Interactions with Diffusion Priors
Thomas Hanwen Zhu, Ruining Li, Tomas Jakab
•
Sep 12, 2024
•
15
3
PiTe: Pixel-Temporale Ausrichtung für große Video-Sprachmodelle
PiTe: Pixel-Temporal Alignment for Large Video-Language Model
Yang Liu, Pengxiang Ding, Siteng Huang, Min Zhang, Han Zhao, Donglin Wang
•
Sep 11, 2024
•
14
2
FlashSplat: 2D zu 3D Gauss'sches Splatting Segmentierung optimal gelöst
FlashSplat: 2D to 3D Gaussian Splatting Segmentation Solved Optimally
Qiuhong Shen, Xingyi Yang, Xinchao Wang
•
Sep 12, 2024
•
12
2
Können OOD-Objektdetektoren von Grundlagenmodellen lernen?
Can OOD Object Detectors Learn from Foundation Models?
Jiahui Liu, Xin Wen, Shizhen Zhao, Yingxian Chen, Xiaojuan Qi
•
Sep 8, 2024
•
9
2