ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
October 14th, 2024
Baichuan-Omni Technischer Bericht
Baichuan-Omni Technical Report
Yadong Li, Haoze Sun, Mingan Lin, Tianpeng Li, Guosheng Dong, Tao Zhang, Bowen Ding, Wei Song, Zhenglin Cheng, Yuqi Huo, Song Chen, Xu Li, Da Pan, Shusen Zhang, Xin Wu, Zheng Liang, Jun Liu, Tao Zhang, Keer Lu, Yaqi Zhao, Yanjun Shen, Fan Yang, Kaicheng Yu, Tao Lin, Jianhua Xu, Zenan Zhou, Weipeng Chen
•
Oct 11, 2024
•
88
8
Meissonic: Belebung von Maskierten Generativen Transformatoren für effiziente hochauflösende Text-zu-Bild-Synthese
Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis
Jinbin Bai, Tian Ye, Wei Chow, Enxin Song, Qing-Guo Chen, Xiangtai Li, Zhen Dong, Lei Zhu, Shuicheng Yan
•
Oct 10, 2024
•
52
2
StructRAG: Steigerung des wissensintensiven Schlussfolgerns von LLMs durch hybride Informationsstrukturierung zur Inferenzzeit
StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization
Zhuoqun Li, Xuanang Chen, Haiyang Yu, Hongyu Lin, Yaojie Lu, Qiaoyu Tang, Fei Huang, Xianpei Han, Le Sun, Yongbin Li
•
Oct 11, 2024
•
50
2
Vom Generalisten zum Spezialisten: Anpassung von Vision-Sprachmodellen durch Aufgabenspezifisches visuelles Anweisungstiming.
From Generalist to Specialist: Adapting Vision Language Models via Task-Specific Visual Instruction Tuning
Yang Bai, Yang Zhou, Jun Zhou, Rick Siow Mong Goh, Daniel Shu Wei Ting, Yong Liu
•
Oct 9, 2024
•
38
2
Multi-Agent Kollaborative Datenauswahl zur effizienten LLM-Vortrainierung
Multi-Agent Collaborative Data Selection for Efficient LLM Pretraining
Tianyi Bai, Ling Yang, Zhen Hao Wong, Jiahui Peng, Xinlin Zhuang, Chi Zhang, Lijun Wu, Qiu Jiantao, Wentao Zhang, Binhang Yuan, Conghui He
•
Oct 10, 2024
•
20
2
Mechanistische Permutabilität: Merkmale über Schichten hinweg abgleichen
Mechanistic Permutability: Match Features Across Layers
Nikita Balagansky, Ian Maksimov, Daniil Gavrilov
•
Oct 10, 2024
•
19
2
EvolveDirector: Annäherung an die fortschrittliche Text-zu-Bild-Generierung mit großen Vision-Sprach-Modellen
EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models
Rui Zhao, Hangjie Yuan, Yujie Wei, Shiwei Zhang, Yuchao Gu, Lingmin Ran, Xiang Wang, Zhangjie Wu, Junhao Zhang, Yingya Zhang, Mike Zheng Shou
•
Oct 9, 2024
•
19
2
SuperCorrect: Überwachung und Korrektur von Sprachmodellen mit fehlergesteuerten Erkenntnissen
SuperCorrect: Supervising and Correcting Language Models with Error-Driven Insights
Ling Yang, Zhaochen Yu, Tianjun Zhang, Minkai Xu, Joseph E. Gonzalez, Bin Cui, Shuicheng Yan
•
Oct 11, 2024
•
17
3
PositionID: LLMs können Längen kontrollieren, kopieren und einfügen mit explizitem Positionsverständnis.
PositionID: LLMs can Control Lengths, Copy and Paste with Explicit Positional Awareness
Zekun Wang, Feiyu Duan, Yibo Zhang, Wangchunshu Zhou, Ke Xu, Wenhao Huang, Jie Fu
•
Oct 9, 2024
•
17
2
Semantische Score-Destillation-Abtastung für die kompositionelle Text-zu-3D-Generierung
Semantic Score Distillation Sampling for Compositional Text-to-3D Generation
Ling Yang, Zixiang Zhang, Junlin Han, Bohan Zeng, Runjia Li, Philip Torr, Wentao Zhang
•
Oct 11, 2024
•
14
2
KV-Vorhersage zur Verbesserung der Zeit bis zum ersten Token.
KV Prediction for Improved Time to First Token
Maxwell Horton, Qingqing Cao, Chenfan Sun, Yanzi Jin, Sachin Mehta, Mohammad Rastegari, Moin Nabi
•
Oct 10, 2024
•
12
2
Denken während des Generierens: Diskrete Diffusion mit geplanter Rauschunterdrückung
Think While You Generate: Discrete Diffusion with Planned Denoising
Sulin Liu, Juno Nam, Andrew Campbell, Hannes Stärk, Yilun Xu, Tommi Jaakkola, Rafael Gómez-Bombarelli
•
Oct 8, 2024
•
11
3
ZeroComp: Zero-Shot-Objekt-Komposition aus Bildintrinsik über Diffusion
ZeroComp: Zero-shot Object Compositing from Image Intrinsics via Diffusion
Zitian Zhang, Frédéric Fortier-Chouinard, Mathieu Garon, Anand Bhattad, Jean-François Lalonde
•
Oct 10, 2024
•
9
3
I-Max: Maximierung des Auflösungspotenzials vorab trainierter rektifizierter Fluss-Transformer mit projiziertem Fluss
I-Max: Maximize the Resolution Potential of Pre-trained Rectified Flow Transformers with Projected Flow
Ruoyi Du, Dongyang Liu, Le Zhuo, Qin Qi, Hongsheng Li, Zhanyu Ma, Peng Gao
•
Oct 10, 2024
•
5
2
DA-Code: Agent Data Science Code Generation Benchmark für große Sprachmodelle
DA-Code: Agent Data Science Code Generation Benchmark for Large Language Models
Yiming Huang, Jianwen Luo, Yan Yu, Yitong Zhang, Fangyu Lei, Yifan Wei, Shizhu He, Lifu Huang, Xiao Liu, Jun Zhao, Kang Liu
•
Oct 9, 2024
•
5
3
MiRAGeNews: Multimodale realistische KI-generierte Nachrichtenerkennung
MiRAGeNews: Multimodal Realistic AI-Generated News Detection
Runsheng Huang, Liam Dugan, Yue Yang, Chris Callison-Burch
•
Oct 11, 2024
•
4
2
SimpleStrat: Diversifizierung der Sprachmodellgenerierung mit Stratifikation
SimpleStrat: Diversifying Language Model Generation with Stratification
Justin Wong, Yury Orlovskiy, Michael Luo, Sanjit A. Seshia, Joseph E. Gonzalez
•
Oct 11, 2024
•
4
2
Mentor-KD: Verbesserung kleiner Sprachmodelle durch Multi-Schritt-Begründungen
Mentor-KD: Making Small Language Models Better Multi-step Reasoners
Hojae Lee, Junho Kim, SangKeun Lee
•
Oct 11, 2024
•
4
2
GenARM: Belohnungsgesteuerte Generierung mit autoregressivem Belohnungsmodell für die Ausrichtung zur Testzeit
GenARM: Reward Guided Generation with Autoregressive Reward Model for Test-time Alignment
Yuancheng Xu, Udari Madhushani Sehwag, Alec Koppel, Sicheng Zhu, Bang An, Furong Huang, Sumitra Ganesh
•
Oct 10, 2024
•
4
2
Synth-SONAR: Sonar-Bildsynthese mit verbesserter Vielfalt und Realismus durch duale Diffusionsmodelle und GPT-Aufforderung
Synth-SONAR: Sonar Image Synthesis with Enhanced Diversity and Realism via Dual Diffusion Models and GPT Prompting
Purushothaman Natarajan, Kamal Basha, Athira Nambiar
•
Oct 11, 2024
•
1
2