ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
June 6th, 2024
Блочный Трансформер: Глобальное-к-Локальному Языковое Моделирование для Быстрого Вывода
Block Transformer: Global-to-Local Language Modeling for Fast Inference
Namgyu Ho, Sangmin Bae, Taehyeon Kim, Hyunjik Jo, Yireun Kim, Tal Schuster, Adam Fisch, James Thorne, Se-Young Yun
•
Jun 4, 2024
•
41
1
Попугай: Настройка многоязычных визуальных инструкций
Parrot: Multilingual Visual Instruction Tuning
Hai-Long Sun, Da-Wei Zhou, Yang Li, Shiyin Lu, Chao Yi, Qing-Guo Chen, Zhao Xu, Weihua Luo, Kaifu Zhang, De-Chuan Zhan, Han-Jia Ye
•
Jun 4, 2024
•
39
2
Мобильный агент-v2: помощник по управлению мобильными устройствами с эффективной навигацией через сотрудничество мультиагентов
Mobile-Agent-v2: Mobile Device Operation Assistant with Effective Navigation via Multi-Agent Collaboration
Junyang Wang, Haiyang Xu, Haitao Jia, Xi Zhang, Ming Yan, Weizhou Shen, Ji Zhang, Fei Huang, Jitao Sang
•
Jun 3, 2024
•
35
2
Ouroboros3D: Генерация 3D изображений с использованием рекурсивной диффузии с учетом трехмерной информации.
Ouroboros3D: Image-to-3D Generation via 3D-aware Recursive Diffusion
Hao Wen, Zehuan Huang, Yaohui Wang, Xinyuan Chen, Yu Qiao, Lu Sheng
•
Jun 5, 2024
•
22
2
Аудио Мамба: Двунаправленная модель пространства состояний для представления аудио. Обучение.
Audio Mamba: Bidirectional State Space Model for Audio Representation Learning
Mehmet Hamza Erol, Arda Senocak, Jiu Feng, Joon Son Chung
•
Jun 5, 2024
•
21
1
PosterLLaVa: Создание единого генератора макетов с несколькими модальностями на основе LLM
PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM
Tao Yang, Yingmin Luo, Zhongang Qi, Yang Wu, Ying Shan, Chang Wen Chen
•
Jun 5, 2024
•
18
2
LiveSpeech: Низколатентное нулевое преобразование текста в речь с помощью авторегрессивного моделирования аудиодискретных кодов
LiveSpeech: Low-Latency Zero-shot Text-to-Speech via Autoregressive Modeling of Audio Discrete Codes
Trung Dang, David Aponte, Dung Tran, Kazuhito Koishida
•
Jun 5, 2024
•
16
2
Поиск априорных данных улучшает синтез текста в видео.
Searching Priors Makes Text-to-Video Synthesis Better
Haoran Cheng, Liang Peng, Linxuan Xia, Yuepeng Hu, Hengjia Li, Qinglin Lu, Xiaofei He, Boxi Wu
•
Jun 5, 2024
•
14
2
Законы масштабирования для переоптимизации модели вознаграждения в алгоритмах прямого выравнивания.
Scaling Laws for Reward Model Overoptimization in Direct Alignment Algorithms
Rafael Rafailov, Yaswanth Chittepu, Ryan Park, Harshit Sikchi, Joey Hejna, Bradley Knox, Chelsea Finn, Scott Niekum
•
Jun 5, 2024
•
14
0
Модель языка для рекомендации в разговорном формате.
Item-Language Model for Conversational Recommendation
Li Yang, Anushya Subbiah, Hardik Patel, Judith Yue Li, Yanwei Song, Reza Mirghaderi, Vikram Aggarwal
•
Jun 5, 2024
•
12
1
PLaD: Дистилляция крупной языковой модели на основе предпочтений с псевдопары предпочтений
PLaD: Preference-based Large Language Model Distillation with Pseudo-Preference Pairs
Rongzhi Zhang, Jiaming Shen, Tianqi Liu, Haorui Wang, Zhen Qin, Feng Han, Jialu Liu, Simon Baumgartner, Michael Bendersky, Chao Zhang
•
Jun 5, 2024
•
11
1
Технический отчет по модели Xmodel-LM
Xmodel-LM Technical Report
Yichuan Wang, Yang Liu, Yu Yan, Xucheng Huang, Ling Jiang
•
Jun 5, 2024
•
11
1