ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
April 16th, 2024
Изучите вашу эталонную модель для действительно хорошего выравнивания.
Learn Your Reference Model for Real Good Alignment
Alexey Gorbatovski, Boris Shaposhnikov, Alexey Malakhov, Nikita Surnachev, Yaroslav Aksenov, Ian Maksimov, Nikita Balagansky, Daniil Gavrilov
•
Apr 15, 2024
•
87
0
Megalodon: Эффективное предварительное обучение и вывод LLM с неограниченной длиной контекста
Megalodon: Efficient LLM Pretraining and Inference with Unlimited Context Length
Xuezhe Ma, Xiaomeng Yang, Wenhan Xiong, Beidi Chen, Lili Yu, Hao Zhang, Jonathan May, Luke Zettlemoyer, Omer Levy, Chunting Zhou
•
Apr 12, 2024
•
68
2
TransformerFAM: Обратная связь внимания - это рабочая память.
TransformerFAM: Feedback attention is working memory
Dongseong Hwang, Weiran Wang, Zhuoyuan Huo, Khe Chai Sim, Pedro Moreno Mengibar
•
Apr 14, 2024
•
44
0
Video2Game: Реальном времени, интерактивная, реалистичная и совместимая с браузером среда из одного видео.
Video2Game: Real-time, Interactive, Realistic and Browser-Compatible Environment from a Single Video
Hongchi Xia, Zhi-Hao Lin, Wei-Chiu Ma, Shenlong Wang
•
Apr 15, 2024
•
31
2
Сжатие представляет интеллект линейно.
Compression Represents Intelligence Linearly
Yuzhen Huang, Jinghan Zhang, Zifei Shan, Junxian He
•
Apr 15, 2024
•
28
1
Ctrl-Adapter: Эффективная и универсальная платформа для адаптации разнообразных управляющих сигналов к любой модели диффузии.
Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model
Han Lin, Jaemin Cho, Abhay Zala, Mohit Bansal
•
Apr 15, 2024
•
22
0
HQ-Edit: Высококачественный набор данных для редактирования изображений на основе инструкций
HQ-Edit: A High-Quality Dataset for Instruction-based Image Editing
Mude Hui, Siwei Yang, Bingchen Zhao, Yichun Shi, Heng Wang, Peng Wang, Yuyin Zhou, Cihang Xie
•
Apr 15, 2024
•
13
0
О Спекулятивном декодировании для мультимодальных больших языковых моделей
On Speculative Decoding for Multimodal Large Language Models
Mukul Gagrani, Raghavv Goel, Wonseok Jeon, Junyoung Park, Mingu Lee, Christopher Lott
•
Apr 13, 2024
•
13
2
Tango 2: Выравнивание генерации текста в аудио на основе диффузии через прямую оптимизацию предпочтений
Tango 2: Aligning Diffusion-based Text-to-Audio Generations through Direct Preference Optimization
Navonil Majumder, Chia-Yu Hung, Deepanway Ghosal, Wei-Ning Hsu, Rada Mihalcea, Soujanya Poria
•
Apr 15, 2024
•
12
0
TextHawk: Исследование эффективного детального восприятия мультимодальных крупномасштабных языковых моделей
TextHawk: Exploring Efficient Fine-Grained Perception of Multimodal Large Language Models
Ya-Qi Yu, Minghui Liao, Jihao Wu, Yongxin Liao, Xiaoyu Zheng, Wei Zeng
•
Apr 14, 2024
•
11
0
Приручение модели скрытой диффузии для восстановления нейронного поля радиантности.
Taming Latent Diffusion Model for Neural Radiance Field Inpainting
Chieh Hubert Lin, Changil Kim, Jia-Bin Huang, Qinbo Li, Chih-Yao Ma, Johannes Kopf, Ming-Hsuan Yang, Hung-Yu Tseng
•
Apr 15, 2024
•
7
0
CompGS: Эффективное представление трехмерной сцены с помощью сжатого гауссовского сплетения.
CompGS: Efficient 3D Scene Representation via Compressed Gaussian Splatting
Xiangrui Liu, Xinju Wu, Pingping Zhang, Shiqi Wang, Zhu Li, Sam Kwong
•
Apr 15, 2024
•
7
0