ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
October 8th, 2024
SwiftKV: Schnelle Inferenz mit optimierter Vorabfüllung und wissenserhaltender Modelltransformation
SwiftKV: Fast Prefill-Optimized Inference with Knowledge-Preserving Model Transformation
Aurick Qiao, Zhewei Yao, Samyam Rajbhandari, Yuxiong He
•
Oct 4, 2024
•
2
2
SELECT: Ein Benchmark im großen Maßstab für Datenkurationsstrategien zur Bildklassifizierung
SELECT: A Large-Scale Benchmark of Data Curation Strategies for Image Classification
Benjamin Feuer, Jiawei Xu, Niv Cohen, Patrick Yubeaton, Govind Mittal, Chinmay Hegde
•
Oct 7, 2024
•
7
2
Die Navigation in der digitalen Welt wie Menschen es tun: Universelles visuelles Fundament für GUI-Agenten.
Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents
Boyu Gou, Ruohan Wang, Boyuan Zheng, Yanan Xie, Cheng Chang, Yiheng Shu, Huan Sun, Yu Su
•
Oct 7, 2024
•
19
2
MathHay: Ein automatisierter Leistungsvergleich für mathematisches Schließen in LLMs
MathHay: An Automated Benchmark for Long-Context Mathematical Reasoning in LLMs
Lei Wang, Shan Dong, Yuhui Xu, Hanze Dong, Yalu Wang, Amrita Saha, Ee-Peng Lim, Caiming Xiong, Doyen Sahoo
•
Oct 7, 2024
•
13
3
Presto! Destillationschritte und -schichten zur Beschleunigung der Musikgenerierung
Presto! Distilling Steps and Layers for Accelerating Music Generation
Zachary Novack, Ge Zhu, Jonah Casebeer, Julian McAuley, Taylor Berg-Kirkpatrick, Nicholas J. Bryan
•
Oct 7, 2024
•
18
4
LLaMA-Berry: Paarweise Optimierung für O1-ähnliche mathematische Argumentation auf Olympiade-Niveau
LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning
Di Zhang, Jianbo Wu, Jingdi Lei, Tong Che, Jiatong Li, Tong Xie, Xiaoshui Huang, Shufei Zhang, Marco Pavone, Yuqiang Li, Wanli Ouyang, Dongzhan Zhou
•
Oct 3, 2024
•
55
4
Benannter klinischer Entitätserkennungs-Benchmark
Named Clinical Entity Recognition Benchmark
Wadood M Abdul, Marco AF Pimentel, Muhammad Umar Salman, Tathagata Raha, Clément Christophe, Praveen K Kanithi, Nasir Hayat, Ronnie Rajan, Shadab Khan
•
Oct 7, 2024
•
17
3
UniMuMo: Vereinigte Generierung von Text, Musik und Bewegung
UniMuMo: Unified Text, Music and Motion Generation
Han Yang, Kun Su, Yutong Zhang, Jiaben Chen, Kaizhi Qian, Gaowen Liu, Chuang Gan
•
Oct 6, 2024
•
19
2
Autonome Charakter-Szenen-Interaktions-Synthese aus Textanweisungen
Autonomous Character-Scene Interaction Synthesis from Text Instruction
Nan Jiang, Zimo He, Zi Wang, Hongjie Li, Yixin Chen, Siyuan Huang, Yixin Zhu
•
Oct 4, 2024
•
7
2
GSM-Symbolisch: Verstehen der Grenzen mathematischer Argumentation in großen Sprachmodellen
GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models
Iman Mirzadeh, Keivan Alizadeh, Hooman Shahrokhi, Oncel Tuzel, Samy Bengio, Mehrdad Farajtabar
•
Oct 7, 2024
•
22
6
ScienceAgentBench: Auf dem Weg zu einer strengen Bewertung von Sprachagenten für datengesteuerte wissenschaftliche Entdeckungen
ScienceAgentBench: Toward Rigorous Assessment of Language Agents for Data-Driven Scientific Discovery
Ziru Chen, Shijie Chen, Yuting Ning, Qianheng Zhang, Boshi Wang, Botao Yu, Yifei Li, Zeyi Liao, Chen Wei, Zitong Lu, Vishal Dey, Mingyi Xue, Frazier N. Baker, Benjamin Burns, Daniel Adu-Ampratwum, Xuhui Huang, Xia Ning, Song Gao, Yu Su, Huan Sun
•
Oct 7, 2024
•
21
2
Zusammenfassung: Token-Level-Detektiv-Belohnungsmodell für große Vision-Sprach-Modelle
TLDR: Token-Level Detective Reward Model for Large Vision Language Models
Deqing Fu, Tong Xiao, Rui Wang, Wang Zhu, Pengchuan Zhang, Guan Pang, Robin Jia, Lawrence Chen
•
Oct 7, 2024
•
17
2
Differenzialtransformator
Differential Transformer
Tianzhu Ye, Li Dong, Yuqing Xia, Yutao Sun, Yi Zhu, Gao Huang, Furu Wei
•
Oct 7, 2024
•
178
35
Neudefinition der zeitlichen Modellierung in der Videodiffusion: Der vektorisierte Zeitschrittansatz
Redefining Temporal Modeling in Video Diffusion: The Vectorized Timestep Approach
Yaofang Liu, Yumeng Ren, Xiaodong Cun, Aitor Artola, Yang Liu, Tieyong Zeng, Raymond H. Chan, Jean-michel Morel
•
Oct 4, 2024
•
5
2
Verankerung von Sprache in multiperspektivischer referentieller Kommunikation
Grounding Language in Multi-Perspective Referential Communication
Zineng Tang, Lingjun Mao, Alane Suhr
•
Oct 4, 2024
•
4
2
Was ist entscheidend für das Zusammenführen von Modellen im großen Maßstab?
What Matters for Model Merging at Scale?
Prateek Yadav, Tu Vu, Jonathan Lai, Alexandra Chronopoulou, Manaal Faruqui, Mohit Bansal, Tsendsuren Munkhdalai
•
Oct 4, 2024
•
8
2
OmniBooth: Erlernen latenter Steuerung für die Bildsynthese mit multimodaler Anleitung
OmniBooth: Learning Latent Control for Image Synthesis with Multi-modal Instruction
Leheng Li, Weichao Qiu, Xu Yan, Jing He, Kaiqiang Zhou, Yingjie Cai, Qing Lian, Bingbing Liu, Ying-Cong Chen
•
Oct 7, 2024
•
9
2
LLMs wissen mehr, als sie zeigen: Über die intrinsische Repräsentation von LLM-Halluzinationen.
LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations
Hadas Orgad, Michael Toker, Zorik Gekhman, Roi Reichart, Idan Szpektor, Hadas Kotek, Yonatan Belinkov
•
Oct 3, 2024
•
49
5
FAN: Fourier-Analyse-Netzwerke
FAN: Fourier Analysis Networks
Yihong Dong, Ge Li, Yongding Tao, Xue Jiang, Kechi Zhang, Jia Li, Jing Su, Jun Zhang, Jingjing Xu
•
Oct 3, 2024
•
27
6
MonST3R: Ein einfacher Ansatz zur Schätzung von Geometrie in Anwesenheit von Bewegung
MonST3R: A Simple Approach for Estimating Geometry in the Presence of Motion
Junyi Zhang, Charles Herrmann, Junhwa Hur, Varun Jampani, Trevor Darrell, Forrester Cole, Deqing Sun, Ming-Hsuan Yang
•
Oct 4, 2024
•
19
3
Videoleitfaden: Verbesserung von Videodiffusionsmodellen ohne Training durch einen Lehrerleitfaden
VideoGuide: Improving Video Diffusion Models without Training Through a Teacher's Guide
Dohun Lee, Bryan S Kim, Geon Yeong Park, Jong Chul Ye
•
Oct 6, 2024
•
30
3
TurtleBench: Evaluierung von Top-Sprachmodellen anhand von Yes/No-Rätseln in der realen Welt
TurtleBench: Evaluating Top Language Models via Real-World Yes/No Puzzles
Qingchen Yu, Shichao Song, Ke Fang, Yunfeng Shi, Zifan Zheng, Hanyu Wang, Simin Niu, Zhiyu Li
•
Oct 7, 2024
•
10
2
SePPO: Halb-Policy-Präferenzoptimierung für Diffusionsausrichtung
SePPO: Semi-Policy Preference Optimization for Diffusion Alignment
Daoan Zhang, Guangchen Lan, Dong-Jun Han, Wenlin Yao, Xiaoman Pan, Hongming Zhang, Mingxiao Li, Pengcheng Chen, Yu Dong, Christopher Brinton, Jiebo Luo
•
Oct 7, 2024
•
5
2