ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
August 26th, 2024
Построение и более глубокое понимание моделей видео-языкового взаимодействия: идеи и перспективы развития
Building and better understanding vision-language models: insights and future directions
Hugo Laurençon, Andrés Marafioti, Victor Sanh, Léo Tronchon
•
Aug 22, 2024
•
131
5
CustomCrafter: Пользовательская генерация видео с сохранением возможностей движения и композиции концепций
CustomCrafter: Customized Video Generation with Preserving Motion and Concept Composition Abilities
Tao Wu, Yong Zhang, Xintao Wang, Xianpan Zhou, Guangcong Zheng, Zhongang Qi, Ying Shan, Xi Li
•
Aug 23, 2024
•
12
2
КОД: Уверенное редактирование обыкновенных дифференциальных уравнений
CODE: Confident Ordinary Differential Editing
Bastien van Delft, Tommaso Martorella, Alexandre Alahi
•
Aug 22, 2024
•
4
2
T3M: Синтез движения человека в 3D по текстовому направлению из речи
T3M: Text Guided 3D Human Motion Synthesis from Speech
Wenshuo Peng, Kaipeng Zhang, Sai Qian Zhang
•
Aug 23, 2024
•
13
2
HiRED: Внимание-управляемое отбрасывание токенов для эффективного вывода моделей высокоразрешающего зрения-языка в ресурсоограниченных средах.
HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments
Kazi Hasan Ibn Arif, JinYi Yoon, Dimitrios S. Nikolopoulos, Hans Vandierendonck, Deepu John, Bo Ji
•
Aug 20, 2024
•
11
2
Веб-ориентированное решение для Федеративного обучения с автоматизацией на основе LLM.
A Web-Based Solution for Federated Learning with LLM-Based Automation
Chamith Mawela, Chaouki Ben Issaid, Mehdi Bennis
•
Aug 23, 2024
•
10
1
MME-RealWorld: Сможет ли ваш мультимодальный LLM справиться с вызовом высокоразрешающих реальных сценариев, которые сложны для людей?
MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans?
Yi-Fan Zhang, Huanyu Zhang, Haochen Tian, Chaoyou Fu, Shuangqing Zhang, Junfei Wu, Feng Li, Kun Wang, Qingsong Wen, Zhang Zhang, Liang Wang, Rong Jin, Tieniu Tan
•
Aug 23, 2024
•
27
4
Градиент многослойных трансформеров можно приблизить практически линейным образом.
Multi-Layer Transformers Gradient Can be Approximated in Almost Linear Time
Yingyu Liang, Zhizhou Sha, Zhenmei Shi, Zhao Song, Yufa Zhou
•
Aug 23, 2024
•
25
4
LayerPano3D: Слойная 3D-панорама для генерации гипер-иммерсивных сцен
LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation
Shuai Yang, Jing Tan, Mengchen Zhang, Tong Wu, Yixuan Li, Gordon Wetzstein, Ziwei Liu, Dahua Lin
•
Aug 23, 2024
•
27
2
FLoD: Интеграция гибкого уровня детализации в трехмерное гауссовское сглаживание для настраиваемого рендеринга
FLoD: Integrating Flexible Level of Detail into 3D Gaussian Splatting for Customizable Rendering
Yunji Seo, Young Sun Choi, Hyun Seung Son, Youngjung Uh
•
Aug 23, 2024
•
6
2
Эффективное с точки зрения памяти обучение LLM с использованием метода онлайн-спуска в подпространство.
Memory-Efficient LLM Training with Online Subspace Descent
Kaizhao Liang, Bo Liu, Lizhang Chen, Qiang Liu
•
Aug 23, 2024
•
14
3
Круглый стол: Использование динамической схемы и контекстуального автозаполнения для повышения точности запросов в системах вопросов и ответов на табличных данных
RoundTable: Leveraging Dynamic Schema and Contextual Autocomplete for Enhanced Query Precision in Tabular Question Answering
Pratyush Kumar, Kuber Vijaykumar Bellad, Bharat Vadlamudi, Aman Chadha
•
Aug 22, 2024
•
5
1