ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
October 4th, 2024
Устранение пересыщения и артефактов высоких масштабов руководства в моделях диффузии
Eliminating Oversaturation and Artifacts of High Guidance Scales in Diffusion Models
Seyedmorteza Sadat, Otmar Hilliges, Romann M. Weber
•
Oct 3, 2024
•
31
4
Контрастное локализованное предварительное обучение языка и изображений
Contrastive Localized Language-Image Pre-Training
Hong-You Chen, Zhengfeng Lai, Haotian Zhang, Xinze Wang, Marcin Eichner, Keen You, Meng Cao, Bowen Zhang, Yinfei Yang, Zhe Gan
•
Oct 3, 2024
•
38
3
Open-RAG: Улучшенное извлечение-дополненное рассуждение с открытыми исходными кодами больших языковых моделей.
Open-RAG: Enhanced Retrieval-Augmented Reasoning with Open-Source Large Language Models
Shayekh Bin Islam, Md Asib Rahman, K S M Tozammel Hossain, Enamul Hoque, Shafiq Joty, Md Rizwan Parvez
•
Oct 2, 2024
•
10
3
Loong: Генерация видеороликов продолжительностью в минуты с помощью авторегрессионных языковых моделей
Loong: Generating Minute-level Long Videos with Autoregressive Language Models
Yuqing Wang, Tianwei Xiong, Daquan Zhou, Zhijie Lin, Yang Zhao, Bingyi Kang, Jiashi Feng, Xihui Liu
•
Oct 3, 2024
•
38
3
VinePPO: Разблокирование потенциала обучения с подкреплением для рассуждения на базе множества меток через улучшенное присвоение кредитов.
VinePPO: Unlocking RL Potential For LLM Reasoning Through Refined Credit Assignment
Amirhossein Kazemnejad, Milad Aghajohari, Eva Portelance, Alessandro Sordoni, Siva Reddy, Aaron Courville, Nicolas Le Roux
•
Oct 2, 2024
•
25
2
CLIP-MoE: Направленность на создание смеси экспертов для CLIP с диверсифицированным повышением кратности.
CLIP-MoE: Towards Building Mixture of Experts for CLIP with Diversified Multiplet Upcycling
Jihai Zhang, Xiaoye Qu, Tong Zhu, Yu Cheng
•
Sep 28, 2024
•
20
2
Контекстные векторные представления документов
Contextual Document Embeddings
John X. Morris, Alexander M. Rush
•
Oct 3, 2024
•
23
4
Замена слоев для нулевой передачи через языковые границы в крупных языковых моделях.
Layer Swapping for Zero-Shot Cross-Lingual Transfer in Large Language Models
Lucas Bandarkar, Benjamin Muller, Pritish Yuvraj, Rui Hou, Nayan Singhal, Hongjiang Lv, Bing Liu
•
Oct 2, 2024
•
5
3
MedVisionLlama: Использование слоев предварительно обученных больших языковых моделей для улучшения сегментации медицинских изображений
MedVisionLlama: Leveraging Pre-Trained Large Language Model Layers to Enhance Medical Image Segmentation
Gurucharan Marthi Krishna Kumar, Aman Chadha, Janine Mendola, Amir Shmuel
•
Oct 3, 2024
•
9
5
Синтио: Дополнение небольших наборов данных классификации аудио синтетическими данными
Synthio: Augmenting Small-Scale Audio Classification Datasets with Synthetic Data
Sreyan Ghosh, Sonal Kumar, Zhifeng Kong, Rafael Valle, Bryan Catanzaro, Dinesh Manocha
•
Oct 2, 2024
•
6
2
Научный инструмент SciPrompt: Знаниевозрастающее подсказывание для тонкой категоризации научных тем.
SciPrompt: Knowledge-augmented Prompting for Fine-grained Categorization of Scientific Topics
Zhiwen You, Kanyao Han, Haotian Zhu, Bertram Ludäscher, Jana Diesner
•
Oct 2, 2024
•
4
3
L-CiteEval: Действительно ли модели с длинным контекстом эффективно используют контекст для ответов?
L-CiteEval: Do Long-Context Models Truly Leverage Context for Responding?
Zecheng Tang, Keyan Zhou, Juntao Li, Baibei Ji, Jianye Hou, Min Zhang
•
Oct 3, 2024
•
10
3
LLaVA-Critic: Обучение оценке мультимодельных моделей
LLaVA-Critic: Learning to Evaluate Multimodal Models
Tianyi Xiong, Xiyao Wang, Dong Guo, Qinghao Ye, Haoqi Fan, Quanquan Gu, Heng Huang, Chunyuan Li
•
Oct 3, 2024
•
36
3
MVGS: Многозрительное регулируемое гауссово наложение для синтеза нового вида.
MVGS: Multi-view-regulated Gaussian Splatting for Novel View Synthesis
Xiaobiao Du, Yida Wang, Xin Yu
•
Oct 2, 2024
•
8
3
Обучение языковых моделей на синтетических последовательностях редактирования улучшает синтез кода.
Training Language Models on Synthetic Edit Sequences Improves Code Synthesis
Ulyana Piterbarg, Lerrel Pinto, Rob Fergus
•
Oct 3, 2024
•
12
3
Изучение скрытых правил игры из данных: история шахмат
Learning the Latent Rules of a Game from Data: A Chess Story
Ben Fauber
•
Oct 3, 2024
•
5
2
Сжатие конечного голосового помощника без обучения по инструкции Данные
Distilling an End-to-End Voice Assistant Without Instruction Training Data
William Held, Ella Li, Michael Ryan, Weiyan Shi, Yanzhe Zhang, Diyi Yang
•
Oct 3, 2024
•
23
5
Robin3D: Улучшение 3D большой языковой модели с помощью устойчивой настройки инструкций
Robin3D: Improving 3D Large Language Model via Robust Instruction Tuning
Weitai Kang, Haifeng Huang, Yuzhang Shang, Mubarak Shah, Yan Yan
•
Sep 30, 2024
•
5
2
Пересмотр данных по подписям к изображениям большого масштаба в предварительном обучении мультимодальных базовых моделей.
Revisit Large-Scale Image-Caption Data in Pre-training Multimodal Foundation Models
Zhengfeng Lai, Vasileios Saveris, Chen Chen, Hong-You Chen, Haotian Zhang, Bowen Zhang, Juan Lao Tebar, Wenze Hu, Zhe Gan, Peter Grasch, Meng Cao, Yinfei Yang
•
Oct 3, 2024
•
55
2
Глубина Pro: четкая монокулярная метрическая глубина менее чем за секунду
Depth Pro: Sharp Monocular Metric Depth in Less Than a Second
Aleksei Bochkovskii, Amaël Delaunoy, Hugo Germain, Marcel Santos, Yichao Zhou, Stephan R. Richter, Vladlen Koltun
•
Oct 2, 2024
•
42
2
Большие языковые модели как цепи Маркова.
Large Language Models as Markov Chains
Oussama Zekri, Ambroise Odonnat, Abdelhakim Benechehab, Linus Bleistein, Nicolas Boullé, Ievgen Redko
•
Oct 3, 2024
•
33
3
Улучшение автономных искусственных интеллектуальных агентов с помощью рефлексивного дерева поиска и самообучения.
Improving Autonomous AI Agents with Reflective Tree Search and Self-Learning
Xiao Yu, Baolin Peng, Vineeth Vajipey, Hao Cheng, Michel Galley, Jianfeng Gao, Zhou Yu
•
Oct 2, 2024
•
9
2
Интеллект на грани хаоса
Intelligence at the Edge of Chaos
Shiyang Zhang, Aakash Patel, Syed A Rizvi, Nianchen Liu, Sizhuang He, Amin Karbasi, Emanuele Zappala, David van Dijk
•
Oct 3, 2024
•
6
2
Интерпретация и редактирование представлений о зрительно-языковых данных для смягчения галлюцинаций.
Interpreting and Editing Vision-Language Representations to Mitigate Hallucinations
Nick Jiang, Anish Kachinthaya, Suzie Petryk, Yossi Gandelsman
•
Oct 3, 2024
•
9
2
Vinoground: Исследование линейных моделей с оценкой плотного временного рассуждения на коротких видео
Vinoground: Scrutinizing LMMs over Dense Temporal Reasoning with Short Videos
Jianrui Zhang, Mu Cai, Yong Jae Lee
•
Oct 3, 2024
•
7
2
Настройка видеоинструкций с использованием синтетических данных
Video Instruction Tuning With Synthetic Data
Yuanhan Zhang, Jinming Wu, Wei Li, Bo Li, Zejun Ma, Ziwei Liu, Chunyuan Li
•
Oct 3, 2024
•
39
3
SageAttention: Точное внимание 8 бит для ускорения подключения и использования.
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration
Jintao Zhang, Jia wei, Pengle Zhang, Jun Zhu, Jianfei Chen
•
Oct 3, 2024
•
50
5