ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
July 4th, 2024
InternLM-XComposer-2.5: Универсальная большая языковая модель видения, поддерживающая длинный контекст ввода и вывода
InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input and Output
Pan Zhang, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Rui Qian, Lin Chen, Qipeng Guo, Haodong Duan, Bin Wang, Linke Ouyang, Songyang Zhang, Wenwei Zhang, Yining Li, Yang Gao, Peng Sun, Xinyue Zhang, Wei Li, Jingwen Li, Wenhai Wang, Hang Yan, Conghui He, Xingcheng Zhang, Kai Chen, Jifeng Dai, Yu Qiao, Dahua Lin, Jiaqi Wang
•
Jul 3, 2024
•
96
5
TabReD: Набор данных для оценки машинного обучения на табличных данных в естественной среде
TabReD: A Benchmark of Tabular Machine Learning in-the-Wild
Ivan Rubachev, Nikolay Kartashev, Yury Gorishniy, Artem Babenko
•
Jun 27, 2024
•
51
6
Без обучения, без проблем: Переосмысление руководства без классификаторов для моделей диффузии
No Training, No Problem: Rethinking Classifier-Free Guidance for Diffusion Models
Seyedmorteza Sadat, Manuel Kansy, Otmar Hilliges, Romann M. Weber
•
Jul 2, 2024
•
26
1
TokenPacker: Эффективный визуальный проектор для мультимодальной LLM
TokenPacker: Efficient Visual Projector for Multimodal LLM
Wentong Li, Yuqian Yuan, Jian Liu, Dongqi Tang, Song Wang, Jianke Zhu, Lei Zhang
•
Jul 2, 2024
•
24
4
PicoAudio: Обеспечение точного управления временем и частотой аудио-событий в генерации речи из текста
PicoAudio: Enabling Precise Timestamp and Frequency Controllability of Audio Events in Text-to-audio Generation
Zeyu Xie, Xuenan Xu, Zhizheng Wu, Mengyue Wu
•
Jul 3, 2024
•
21
5
DisCo-Diff: Улучшение непрерывных моделей диффузии с дискретными латентными переменными
DisCo-Diff: Enhancing Continuous Diffusion Models with Discrete Latents
Yilun Xu, Gabriele Corso, Tommi Jaakkola, Arash Vahdat, Karsten Kreis
•
Jul 3, 2024
•
14
1
Исследование моделей больших языковых декодеров только для преобразования речи в текст
Investigating Decoder-only Large Language Models for Speech-to-text Translation
Chao-Wei Huang, Hui Lu, Hongyu Gong, Hirofumi Inaguma, Ilia Kulikov, Ruslan Mavlyutov, Sravya Popuri
•
Jul 3, 2024
•
11
1
Ложное чувство безопасности: небезопасные утечки информации в «безопасном» искусственном интеллекте. Ответы
A False Sense of Safety: Unsafe Information Leakage in 'Safe' AI Responses
David Glukhov, Ziwen Han, Ilia Shumailov, Vardan Papyan, Nicolas Papernot
•
Jul 2, 2024
•
9
1
Избавление от позиционного смещения языковых моделей: механистический подход
Eliminating Position Bias of Language Models: A Mechanistic Approach
Ziqi Wang, Hanlin Zhang, Xiner Li, Kuan-Hao Huang, Chi Han, Shuiwang Ji, Sham M. Kakade, Hao Peng, Heng Ji
•
Jul 1, 2024
•
8
1