ChatPaper.aiChatPaper.ai
Startseite

arXiv

HuggingFace

PreiseKontoArbeitsbereich

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

KI-Forschungspapiere Täglich

Täglich kuratierte KI-Forschungspapiere mit Übersetzungen

Der Prompt-Bericht: Eine systematische Untersuchung von Anweisungstechniken
The Prompt Report: A Systematic Survey of Prompting Techniques

Sander Schulhoff, Michael Ilie, Nishant Balepur, Konstantine Kahadze, Amanda Liu, Chenglei Si, Yinheng Li, Aayush Gupta, HyoJung Han, Sevien Schulhoff, Pranav Sandeep Dulepet, Saurav Vidyadhara, Dayeon Ki, Sweta Agrawal, Chau Pham, Gerson Kroiz, Feileen Li, Hudson Tao, Ashay Srivastava, Hevander Da Costa, Saloni Gupta, Megan L. Rogers, Inna Goncearenco, Giuseppe Sarli, Igor Galynker, Denis Peskoff, Marine Carpuat, Jules White, Shyamal Anadkat, Alexander Hoyle, Philip Resnik•Jun 6, 2024•644

Ein Bild ist 32 Token wert für Rekonstruktion und Generierung.
An Image is Worth 32 Tokens for Reconstruction and Generation

Qihang Yu, Mark Weber, Xueqing Deng, Xiaohui Shen, Daniel Cremers, Liang-Chieh Chen•Jun 11, 2024•6020

McEval: Massiv mehrsprachige Code-Bewertung
McEval: Massively Multilingual Code Evaluation

Linzheng Chai, Shukai Liu, Jian Yang, Yuwei Yin, Ke Jin, Jiaheng Liu, Tao Sun, Ge Zhang, Changyu Ren, Hongcheng Guo, Zekun Wang, Boyang Wang, Xianjie Wu, Bing Wang, Tongliang Li, Liqun Yang, Sufeng Duan, Zhoujun Li•Jun 11, 2024•421

Nullschuss-Bildbearbeitung mit Referenzimitation
Zero-shot Image Editing with Reference Imitation

Xi Chen, Yutong Feng, Mengting Chen, Yiyang Wang, Shilong Zhang, Yu Liu, Yujun Shen, Hengshuang Zhao•Jun 11, 2024•343

TextGrad: Automatische "Differentiation" über Text
TextGrad: Automatic "Differentiation" via Text

Mert Yuksekgonul, Federico Bianchi, Joseph Boen, Sheng Liu, Zhi Huang, Carlos Guestrin, James Zou•Jun 11, 2024•320

Verbessern Sie mathematisches Denken in Sprachmodellen durch automatisierte Prozessüberwachung.
Improve Mathematical Reasoning in Language Models by Automated Process Supervision

Liangchen Luo, Yinxiao Liu, Rosanne Liu, Samrat Phatale, Harsh Lara, Yunxuan Li, Lei Shu, Yun Zhu, Lei Meng, Jiao Sun, Abhinav Rastogi•Jun 5, 2024•300

Zugriff auf GPT-4-Level Mathematische Olympiade-Lösungen über Monte Carlo Tree Self-refine mit LLaMa-3 8B
Accessing GPT-4 level Mathematical Olympiad Solutions via Monte Carlo Tree Self-refine with LLaMa-3 8B

Di Zhang, Jiatong Li, Xiaoshui Huang, Dongzhan Zhou, Yuqiang Li, Wanli Ouyang•Jun 11, 2024•291

Skywork-MoE: Ein ausführlicher Einblick in Trainingsmethoden für Mixture-of-Experts Sprachmodelle
Skywork-MoE: A Deep Dive into Training Techniques for Mixture-of-Experts Language Models

Tianwen Wei, Bo Zhu, Liang Zhao, Cheng Cheng, Biye Li, Weiwei Lü, Peng Cheng, Jianhao Zhang, Xiaoyu Zhang, Liang Zeng, Xiaokun Wang, Yutuan Ma, Rui Hu, Shuicheng Yan, Han Fang, Yahui Zhou•Jun 3, 2024•2010

SEE-2-SOUND: Nullschuss räumliche Umgebung zu räumlichem Klang
SEE-2-SOUND: Zero-Shot Spatial Environment-to-Spatial Sound

Rishit Dagli, Shivesh Prakash, Robert Wu, Houman Khosravani•Jun 6, 2024•160

4Real: Auf dem Weg zur fotorealistischen 4D-Szenengenerierung mittels Video-Diffusionsmodellen
4Real: Towards Photorealistic 4D Scene Generation via Video Diffusion Models

Heng Yu, Chaoyang Wang, Peiye Zhuang, Willi Menapace, Aliaksandr Siarohin, Junli Cao, Laszlo A Jeni, Sergey Tulyakov, Hsin-Ying Lee•Jun 11, 2024•133

AsyncDiff: Paralleleisierung von Diffusionsmodellen durch asynchrones Denoising
AsyncDiff: Parallelizing Diffusion Models by Asynchronous Denoising

Zigeng Chen, Xinyin Ma, Gongfan Fang, Zhenxiong Tan, Xinchao Wang•Jun 11, 2024•121

Einfache und effektive maskierte Diffusions-Sprachmodelle
Simple and Effective Masked Diffusion Language Models

Subham Sekhar Sahoo, Marianne Arriola, Yair Schiff, Aaron Gokaslan, Edgar Marroquin, Justin T Chiu, Alexander Rush, Volodymyr Kuleshov•Jun 11, 2024•112

MedFuzz: Erforschung der Robustheit großer Sprachmodelle in der medizinischen Fragebeantwortung
MedFuzz: Exploring the Robustness of Large Language Models in Medical Question Answering

Robert Osazuwa Ness, Katie Matton, Hayden Helm, Sheng Zhang, Junaid Bajwa, Carey E. Priebe, Eric Horvitz•Jun 3, 2024•110

Die Trennung des "Chirps" vom "Chat": Selbstüberwachte visuelle Verankerung von Ton und Sprache.
Separating the "Chirp" from the "Chat": Self-supervised Visual Grounding of Sound and Language

Mark Hamilton, Andrew Zisserman, John R. Hershey, William T. Freeman•Jun 9, 2024•81

Neuronaler Gaffer: Neubeleuchtung eines beliebigen Objekts durch Diffusion
Neural Gaffer: Relighting Any Object via Diffusion

Haian Jin, Yuan Li, Fujun Luan, Yuanbo Xiangli, Sai Bi, Kai Zhang, Zexiang Xu, Jin Sun, Noah Snavely•Jun 11, 2024•62

Die Fusion verbessert die Selbstkritik gegen Jailbreak-Angriffe.
Merging Improves Self-Critique Against Jailbreak Attacks

Victor Gallego•Jun 11, 2024•40