ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
November 25th, 2024
Anpassung von Vision-Grundlagenmodellen für robuste Cloud-Segmentierung in Fernerkundungsbildern
Adapting Vision Foundation Models for Robust Cloud Segmentation in Remote Sensing Images
Xuechao Zou, Shun Zhang, Kai Li, Shiying Wang, Junliang Xing, Lei Jin, Congyan Lang, Pin Tao
•
Nov 20, 2024
•
4
2
Einer, um sie alle zu beherrschen: natürliche Sprache zur Verknüpfung von Kommunikation, Wahrnehmung und Handlung.
One to rule them all: natural language to bind communication, perception and action
Simone Colombani, Dimitri Ognibene, Giuseppe Boccignone
•
Nov 22, 2024
•
3
2
Meine Zeitmaschine: Personalisierte Gesichtsalterstransformation
MyTimeMachine: Personalized Facial Age Transformation
Luchao Qi, Jiaye Wu, Bang Gong, Annie N. Wang, David W. Jacobs, Roni Sengupta
•
Nov 21, 2024
•
22
2
WildLMa: Langfristige Horizont-Loco-Manipulation in freier Wildbahn
WildLMa: Long Horizon Loco-Manipulation in the Wild
Ri-Zhao Qiu, Yuchen Song, Xuanbin Peng, Sai Aneesh Suryadevara, Ge Yang, Minghuan Liu, Mazeyu Ji, Chengzhe Jia, Ruihan Yang, Xueyan Zou, Xiaolong Wang
•
Nov 22, 2024
•
6
2
Effiziente Tokenisierung langer Videos durch Patch-basierte Koordinatenrekonstruktion.
Efficient Long Video Tokenization via Coordinated-based Patch Reconstruction
Huiwon Jang, Sihyun Yu, Jinwoo Shin, Pieter Abbeel, Younggyo Seo
•
Nov 22, 2024
•
11
2
Eine flexible Methodik zur Entwicklung von Leitplanken für große Sprachmodelle angewendet auf die Erkennung von nicht zum Thema passenden Anfragen
A Flexible Large Language Models Guardrail Development Methodology Applied to Off-Topic Prompt Detection
Gabriel Chua, Shing Yee Chan, Shaun Khoo
•
Nov 20, 2024
•
23
2
Stilfreundlicher SNR-Sampler für stildominierte Generierung
Style-Friendly SNR Sampler for Style-Driven Generation
Jooyoung Choi, Chaehun Shin, Yeongtak Oh, Heeseung Kim, Sungroh Yoon
•
Nov 22, 2024
•
35
3
BALROG: Benchmarking des agentischen LLM- und VLM-Reasonings in Spielen
BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games
Davide Paglieri, Bartłomiej Cupiał, Samuel Coward, Ulyana Piterbarg, Maciej Wolczyk, Akbir Khan, Eduardo Pignatelli, Łukasz Kuciński, Lerrel Pinto, Rob Fergus, Jakob Nicolaus Foerster, Jack Parker-Holder, Tim Rocktäschel
•
Nov 20, 2024
•
18
2
TÜLU 3: Vorstoß in die Grenzbereiche des Open Language Model Post-Trainings
TÜLU 3: Pushing Frontiers in Open Language Model Post-Training
Nathan Lambert, Jacob Morrison, Valentina Pyatkin, Shengyi Huang, Hamish Ivison, Faeze Brahman, Lester James V. Miranda, Alisa Liu, Nouha Dziri, Shane Lyu, Yuling Gu, Saumya Malik, Victoria Graf, Jena D. Hwang, Jiangjiang Yang, Ronan Le Bras, Oyvind Tafjord, Chris Wilhelm, Luca Soldaini, Noah A. Smith, Yizhong Wang, Pradeep Dasigi, Hannaneh Hajishirzi
•
Nov 22, 2024
•
63
2
OminiControl: Minimale und universelle Steuerung für den Diffusionstransformator
OminiControl: Minimal and Universal Control for Diffusion Transformer
Zhenxiong Tan, Songhua Liu, Xingyi Yang, Qiaochu Xue, Xinchao Wang
•
Nov 22, 2024
•
60
10
Große multimodale Modelle können Merkmale in großen multimodalen Modellen interpretieren.
Large Multi-modal Models Can Interpret Features in Large Multi-modal Models
Kaichen Zhang, Yifei Shen, Bo Li, Ziwei Liu
•
Nov 22, 2024
•
17
4
VideoEspresso: Ein umfangreiches Ketten-von-Gedanken-Datenset für Feinabstufungs-Videobegründung durch Kernbildauswahl
VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection
Songhao Han, Wei Huang, Hairong Shi, Le Zhuo, Xiu Su, Shifeng Zhang, Xu Zhou, Xiaojuan Qi, Yue Liao, Si Liu
•
Nov 22, 2024
•
13
3
VideoRepair: Verbesserung der Text-zu-Video-Generierung durch Bewertung von Fehlausrichtung und lokaler Verfeinerung
VideoRepair: Improving Text-to-Video Generation via Misalignment Evaluation and Localized Refinement
Daeun Lee, Jaehong Yoon, Jaemin Cho, Mohit Bansal
•
Nov 22, 2024
•
9
3
Neuartige Ansichtsextrapolation mit Video-Diffusionsprioritäten
Novel View Extrapolation with Video Diffusion Priors
Kunhao Liu, Ling Shao, Shijian Lu
•
Nov 21, 2024
•
10
3