ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
March 13th, 2025
RewardSDS: Согласование дистилляции оценок через взвешенную по вознаграждению выборку
RewardSDS: Aligning Score Distillation via Reward-Weighted Sampling
Itay Chachy, Guy Yariv, Sagie Benaim
•
Mar 12, 2025
•
15
2
GTR: Управляемое Усиление Мышления Предотвращает Коллапс Мысли при Обучении Агентов VLM на Основе RL
GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training
Tong Wei, Yijun Yang, Junliang Xing, Yuanchun Shi, Zongqing Lu, Deheng Ye
•
Mar 11, 2025
•
17
2
Квантование крупных языковых моделей для генерации кода: дифференцированная репликация
Quantizing Large Language Models for Code Generation: A Differentiated Replication
Alessandro Giagnorio, Antonio Mastropaolo, Saima Afrin, Massimiliano Di Penta, Gabriele Bavota
•
Mar 10, 2025
•
8
2
MoC: Ансамбли моделей для сегментации текстовых блоков в системе генерации с расширением на основе поиска
MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System
Jihao Zhao, Zhiyuan Ji, Zhaoxin Fan, Hanyu Wang, Simin Niu, Bo Tang, Feiyu Xiong, Zhiyu Li
•
Mar 12, 2025
•
4
3
PhysicsGen: Могут ли генеративные модели обучаться на изображениях для прогнозирования сложных физических взаимосвязей?
PhysicsGen: Can Generative Models Learn from Images to Predict Complex Physical Relations?
Martin Spitznagel, Jan Vaillant, Janis Keuper
•
Mar 7, 2025
•
8
2
Больше документов, та же длина: выделение проблемы работы с несколькими документами в RAG
More Documents, Same Length: Isolating the Challenge of Multiple Documents in RAG
Shahar Levy, Nir Mazor, Lihi Shalmon, Michael Hassid, Gabriel Stanovsky
•
Mar 6, 2025
•
16
3
Motion Anything: Генерация движения из чего угодно
Motion Anything: Any to Motion Generation
Zeyu Zhang, Yiran Wang, Wei Mao, Danning Li, Rui Zhao, Biao Wu, Zirui Song, Bohan Zhuang, Ian Reid, Richard Hartley
•
Mar 10, 2025
•
32
6
VLog: Видео-языковые модели через генеративное извлечение нарратива Словарь
VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary
Kevin Qinghong Lin, Mike Zheng Shou
•
Mar 12, 2025
•
7
2
Оптимизированное по стоимости групповое внимание с запросами для языковых моделей с длинным контекстом
Cost-Optimal Grouped-Query Attention for Long-Context LLMs
Yingfa Chen, Yutong Wu, Xu Han, Zhiyuan Liu, Maosong Sun
•
Mar 12, 2025
•
5
2
Монте-Карло диффузия для обобщаемого обучения в RANSAC на основе машинного обучения
Monte Carlo Diffusion for Generalizable Learning-Based RANSAC
Jiale Wang, Chen Zhao, Wei Ke, Tong Zhang
•
Mar 12, 2025
•
1
2
Блок-диффузия: Интерполяция между авторегрессивными и диффузионными языковыми моделями
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models
Marianne Arriola, Aaron Gokaslan, Justin T Chiu, Zhihan Yang, Zhixuan Qi, Jiaqi Han, Subham Sekhar Sahoo, Volodymyr Kuleshov
•
Mar 12, 2025
•
71
3
WildIFEval: Следование инструкциям в реальных условиях
WildIFEval: Instruction Following in the Wild
Gili Lior, Asaf Yehudai, Ariel Gera, Liat Ein-Dor
•
Mar 9, 2025
•
13
4
BIMBA: Селективное сканирование сжатия для задач видео-вопросов с длинным диапазоном
BIMBA: Selective-Scan Compression for Long-Range Video Question Answering
Md Mohaiminul Islam, Tushar Nagarajan, Huiyu Wang, Gedas Bertasius, Lorenzo Torresani
•
Mar 12, 2025
•
3
2
Понимание и смягчение сдвигов распределения в машинном обучении Силовые поля
Understanding and Mitigating Distribution Shifts For Machine Learning Force Fields
Tobias Kreiman, Aditi S. Krishnapriyan
•
Mar 11, 2025
•
0
3
Мультиагентный медицинский помощник для периферийных устройств
Multi Agent based Medical Assistant for Edge Devices
Sakharam Gawade, Shivam Akhouri, Chinmay Kulkarni, Jagdish Samant, Pragya Sahu, Aastik, Jai Pahal, Saswat Meher
•
Mar 7, 2025
•
7
2
Модели латентного диффузионного синтеза без псевдонимов: улучшение эквивариантности к дробным сдвигам в латентном пространстве диффузии
Alias-Free Latent Diffusion Models:Improving Fractional Shift Equivariance of Diffusion Latent Space
Yifan Zhou, Zeqi Xiao, Shuai Yang, Xingang Pan
•
Mar 12, 2025
•
6
2
Search-R1: Обучение больших языковых моделей рассуждению и использованию поисковых систем с помощью обучения с подкреплением
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning
Bowen Jin, Hansi Zeng, Zhenrui Yue, Dong Wang, Hamed Zamani, Jiawei Han
•
Mar 12, 2025
•
28
2
Когда большая модель обработки изображений и текста встречается с крупномасштабными снимками дистанционного зондирования: Постепенная обрезка токенов с текстовым управлением от грубой к детальной
When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning
Junwei Luo, Yingying Zhang, Xue Yang, Kang Wu, Qi Zhu, Lei Liang, Jingdong Chen, Yansheng Li
•
Mar 10, 2025
•
7
3
Мультимодальное языковое моделирование для высокоточного анализа и генерации данных транскриптомики единичных клеток
Multimodal Language Modeling for High-Accuracy Single Cell Transcriptomics Analysis and Generation
Yaorui Shi, Jiaqi Yang, Sihang Li, Junfeng Fang, Xiang Wang, Zhiyuan Liu, Yang Zhang
•
Mar 12, 2025
•
4
2
Самообучение с самокоррекцией для небольших языковых моделей
Self-Taught Self-Correction for Small Language Models
Viktor Moskvoretskii, Chris Biemann, Irina Nikishina
•
Mar 11, 2025
•
15
2
TPDiff: Временная пирамидальная модель диффузии видео
TPDiff: Temporal Pyramid Video Diffusion Model
Lingmin Ran, Mike Zheng Shou
•
Mar 12, 2025
•
45
3
Reangle-A-Video: Генерация 4D-видео как задача перевода видео в видео
Reangle-A-Video: 4D Video Generation as Video-to-Video Translation
Hyeonho Jeong, Suhyeon Lee, Jong Chul Ye
•
Mar 12, 2025
•
32
2