ChatPaper.aiChatPaper.ai
Startseite

arXiv

HuggingFace

PreiseKontoArbeitsbereich

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

KI-Forschungspapiere Täglich

Täglich kuratierte KI-Forschungspapiere mit Übersetzungen

Diebstahl eines Teils eines Produktions-Sprachmodells
Stealing Part of a Production Language Model

Nicholas Carlini, Daniel Paleka, Krishnamurthy Dj Dvijotham, Thomas Steinke, Jonathan Hayase, A. Feder Cooper, Katherine Lee, Matthew Jagielski, Milad Nasr, Arthur Conmy, Eric Wallace, David Rolnick, Florian Tramèr•Mar 11, 2024•923

Hinzufügen von NVMe-SSDs zur Aktivierung und Beschleunigung des Feinabstimmens eines 100B-Modells auf einer einzelnen GPU.
Adding NVMe SSDs to Enable and Accelerate 100B Model Fine-tuning on a Single GPU

Changyue Liao, Mo Sun, Zihan Yang, Kaiqi Chen, Binhang Yuan, Fei Wu, Zeke Wang•Mar 11, 2024•554

VideoMamba: Zustandsraummodell für effizientes Videoverständnis
VideoMamba: State Space Model for Efficient Video Understanding

Kunchang Li, Xinhao Li, Yi Wang, Yinan He, Yali Wang, Limin Wang, Yu Qiao•Mar 11, 2024•312

V3D: Videodiffusionsmodelle sind effektive 3D-Generatoren.
V3D: Video Diffusion Models are Effective 3D Generators

Zilong Chen, Yikai Wang, Feng Wang, Zhengyi Wang, Huaping Liu•Mar 11, 2024•314

Ein Bild ist nach Schicht 2 die Hälfte eines Tokens wert: Plug-and-Play Inferenzbeschleunigung für große Vision-Sprach-Modelle
An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models

Liang Chen, Haozhe Zhao, Tianyu Liu, Shuai Bai, Junyang Lin, Chang Zhou, Baobao Chang•Mar 11, 2024•292

Algorithmischer Fortschritt bei Sprachmodellen
Algorithmic progress in language models

Anson Ho, Tamay Besiroglu, Ege Erdil, David Owen, Robi Rahman, Zifan Carl Guo, David Atkinson, Neil Thompson, Jaime Sevilla•Mar 9, 2024•211

VidProM: Ein Real Prompt-Galerie-Datensatz im Millionenmaßstab für Text-zu-Video-Diffusionsmodelle
VidProM: A Million-scale Real Prompt-Gallery Dataset for Text-to-Video Diffusion Models

Wenhao Wang, Yi Yang•Mar 10, 2024•174

Mehrstufige Konsistenzmodelle
Multistep Consistency Models

Jonathan Heek, Emiel Hoogeboom, Tim Salimans•Mar 11, 2024•161

FaceChain-SuDe: Aufbau einer abgeleiteten Klasse zur Vererbung von Kategorieattributen für die einmalige, subjektgesteuerte Generierung.
FaceChain-SuDe: Building Derived Class to Inherit Category Attributes for One-shot Subject-Driven Generation

Pengchong Qiao, Lei Shang, Chang Liu, Baigui Sun, Xiangyang Ji, Jie Chen•Mar 11, 2024•51