ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
October 2nd, 2024
Embodied-RAG: Allgemeines nicht-parametrisches verkörpertes Gedächtnis für Abruf und Generierung
Embodied-RAG: General non-parametric Embodied Memory for Retrieval and Generation
Quanting Xie, So Yeon Min, Tianyi Zhang, Aarav Bajaj, Ruslan Salakhutdinov, Matthew Johnson-Roberson, Yonatan Bisk
•
Sep 26, 2024
•
3
2
Ein Token, um sie alle zu segmentieren: Sprachgesteuerte Segmentierung des Denkens in Videos.
One Token to Seg Them All: Language Instructed Reasoning Segmentation in Videos
Zechen Bai, Tong He, Haiyang Mei, Pichao Wang, Ziteng Gao, Joya Chen, Lei Liu, Zheng Zhang, Mike Zheng Shou
•
Sep 29, 2024
•
19
3
Flex3D: Feed-Forward 3D Generierung mit flexiblem Rekonstruktionsmodell und Eingabebetrachtung
Flex3D: Feed-Forward 3D Generation With Flexible Reconstruction Model And Input View Curation
Junlin Han, Jianyuan Wang, Andrea Vedaldi, Philip Torr, Filippos Kokkinos
•
Oct 1, 2024
•
20
5
TPI-LLM: Effiziente Bereitstellung von LLMs im Maßstab von 70 Milliarden auf ressourcenarmen Edge-Geräten
TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices
Zonghang Li, Wenjiao Feng, Mohsen Guizani, Hongfang Yu
•
Oct 1, 2024
•
33
8
ACE: Allround-Schöpfer und Editor zur Befolgung von Anweisungen über Diffusionstransformer
ACE: All-round Creator and Editor Following Instructions via Diffusion Transformer
Zhen Han, Zeyinzi Jiang, Yulin Pan, Jingfeng Zhang, Chaojie Mao, Chenwei Xie, Yu Liu, Jingren Zhou
•
Sep 30, 2024
•
12
2
SyntheOcc: Synthese von geometrisch gesteuerten Straßenansichtsbildern durch 3D semantische MPIs
SyntheOcc: Synthesize Geometric-Controlled Street View Images through 3D Semantic MPIs
Leheng Li, Weichao Qiu, Yingjie Cai, Xu Yan, Qing Lian, Bingbing Liu, Ying-Cong Chen
•
Oct 1, 2024
•
11
2
DressRecon: Freie 4D-Menschrekonstruktion aus monokularem Video
DressRecon: Freeform 4D Human Reconstruction from Monocular Video
Jeff Tan, Donglai Xiang, Shubham Tulsiani, Deva Ramanan, Gengshan Yang
•
Sep 30, 2024
•
9
2
Welcher Schaden entsteht? Quantifizierung des greifbaren Einflusses von Geschlechterbias in der maschinellen Übersetzung durch eine studiezentrierte Untersuchung.
What the Harm? Quantifying the Tangible Impact of Gender Bias in Machine Translation with a Human-centered Study
Beatrice Savoldi, Sara Papi, Matteo Negri, Ana Guerberof, Luisa Bentivogli
•
Oct 1, 2024
•
5
2
Gesetz des schwächsten Glieds: Querfähigkeiten großer Sprachmodelle
Law of the Weakest Link: Cross Capabilities of Large Language Models
Ming Zhong, Aston Zhang, Xuewei Wang, Rui Hou, Wenhan Xiong, Chenguang Zhu, Zhengxing Chen, Liang Tan, Chloe Bi, Mike Lewis, Sravya Popuri, Sharan Narang, Melanie Kambadur, Dhruv Mahajan, Sergey Edunov, Jiawei Han, Laurens van der Maaten
•
Sep 30, 2024
•
55
2
Atlas-Chat: Anpassung großer Sprachmodelle für den ressourcenarmen marokkanischen arabischen Dialekt
Atlas-Chat: Adapting Large Language Models for Low-Resource Moroccan Arabic Dialect
Guokan Shang, Hadi Abdine, Yousef Khoubrane, Amr Mohamed, Yassine Abbahaddou, Sofiane Ennadir, Imane Momayiz, Xuguang Ren, Eric Moulines, Preslav Nakov, Michalis Vazirgiannis, Eric Xing
•
Sep 26, 2024
•
29
2
Visueller Kontextfenster-Erweiterung: Eine neue Perspektive für das Verständnis langer Videos
Visual Context Window Extension: A New Perspective for Long Video Understanding
Hongchen Wei, Zhenzhong Chen
•
Sep 30, 2024
•
11
2
Posterior-Mittelwert-geregelte Strömung: Auf dem Weg zur minimalen MSE fotorealistischen Bildwiederherstellung
Posterior-Mean Rectified Flow: Towards Minimum MSE Photo-Realistic Image Restoration
Guy Ohayon, Tomer Michaeli, Michael Elad
•
Oct 1, 2024
•
10
3
Illustrious: Ein offenes fortgeschrittenes Illustrationsmodell
Illustrious: an Open Advanced Illustration Model
Sang Hyun Park, Jun Young Koh, Junha Lee, Joy Song, Dongha Kim, Hoyeon Moon, Hyunju Lee, Min Song
•
Sep 30, 2024
•
16
3
Hilfreicher DoggyBot: Objektsuche in offenen Welten mit vierbeinigen Robotern und Vision-Sprach-Modellen
Helpful DoggyBot: Open-World Object Fetching using Legged Robots and Vision-Language Models
Qi Wu, Zipeng Fu, Xuxin Cheng, Xiaolong Wang, Chelsea Finn
•
Sep 30, 2024
•
8
2