ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
February 13th, 2025
DPO-Shift: Изменение распределения оптимизации прямых предпочтений
DPO-Shift: Shifting the Distribution of Direct Preference Optimization
Xiliang Yang, Feng Jiang, Qianen Zhang, Lei Zhao, Xiao Li
•
Feb 11, 2025
•
15
2
Игнорируйте штраф KL! Повышение исследования критических токенов для улучшения тонкой настройки RL.
Ignore the KL Penalty! Boosting Exploration on Critical Tokens to Enhance RL Fine-Tuning
Jean Vassoyan, Nathanaël Beau, Roman Plaud
•
Feb 10, 2025
•
18
2
К Надежному Поиску с Расширенной Генерацией для Больших Языковых Моделей: Обзор
Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey
Bo Ni, Zheyuan Liu, Leyao Wang, Yongjia Lei, Yuying Zhao, Xueqi Cheng, Qingkai Zeng, Luna Dong, Yinglong Xia, Krishnaram Kenthapadi, Ryan Rossi, Franck Dernoncourt, Md Mehrab Tanjim, Nesreen Ahmed, Xiaorui Liu, Wenqi Fan, Erik Blasch, Yu Wang, Meng Jiang, Tyler Derr
•
Feb 8, 2025
•
8
2
WorldGUI: Динамическое тестирование для комплексной автоматизации графического интерфейса рабочего стола.
WorldGUI: Dynamic Testing for Comprehensive Desktop GUI Automation
Henry Hengyuan Zhao, Difei Gao, Mike Zheng Shou
•
Feb 12, 2025
•
27
4
TextAtlas5M: крупномасштабный набор данных для генерации плотных изображений текста.
TextAtlas5M: A Large-scale Dataset for Dense Text Image Generation
Alex Jinpeng Wang, Dongxing Mao, Jiawei Zhang, Weiming Han, Zhuobai Dong, Linjie Li, Yiqi Lin, Zhengyuan Yang, Libo Qin, Fuwei Zhang, Lijuan Wang, Min Li
•
Feb 11, 2025
•
45
2
LASP-2: Переосмысление последовательной параллельности для линейного внимания и его гибридного подхода
LASP-2: Rethinking Sequence Parallelism for Linear Attention and Its Hybrid
Weigao Sun, Disen Lan, Yiran Zhong, Xiaoye Qu, Yu Cheng
•
Feb 11, 2025
•
24
2
Light-A-Video: Обучение-бесплатное изменение освещения видео с помощью постепенного слияния света
Light-A-Video: Training-free Video Relighting via Progressive Light Fusion
Yujie Zhou, Jiazi Bu, Pengyang Ling, Pan Zhang, Tong Wu, Qidong Huang, Jinsong Li, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Anyi Rao, Jiaqi Wang, Li Niu
•
Feb 12, 2025
•
44
2
TransMLA: Многоголовое скрытое внимание - все, что вам нужно.
TransMLA: Multi-head Latent Attention Is All You Need
Fanxu Meng, Zengwei Yao, Muhan Zhang
•
Feb 11, 2025
•
49
9
PDE-контроллер: LLM для автоформализации и рассуждений о уравнениях в частных производных
PDE-Controller: LLMs for Autoformalization and Reasoning of PDEs
Mauricio Soroco, Jialin Song, Mengzhou Xia, Kye Emond, Weiran Sun, Wuyang Chen
•
Feb 3, 2025
•
16
2
MetaSC: Оптимизация спецификации безопасности во время тестирования для языковых моделей
MetaSC: Test-Time Safety Specification Optimization for Language Models
Víctor Gallego
•
Feb 11, 2025
•
3
2
Файл 1: О переносимости улучшенных рассуждений LLM в финансы
Fino1: On the Transferability of Reasoning Enhanced LLMs to Finance
Lingfei Qian, Weipeng Zhou, Yan Wang, Xueqing Peng, Jimin Huang, Qianqian Xie
•
Feb 12, 2025
•
56
5
SARChat-Bench-2M: Мультизадачный бенчмарк для визуально-языковой интерпретации SAR-изображений
SARChat-Bench-2M: A Multi-Task Vision-Language Benchmark for SAR Image Interpretation
Zhiming Ma, Xiayang Xiao, Sihao Dong, Peidong Wang, HaiPeng Wang, Qingyun Pan
•
Feb 12, 2025
•
12
4
Модули LLM: Передача знаний от большой модели к маленькой с использованием улучшенного кросс-внимания
LLM Modules: Knowledge Transfer from a Large to a Small Model using Enhanced Cross-Attention
Konstantin Kolomeitsev
•
Feb 12, 2025
•
4
2
Законы масштабирования дистилляции
Distillation Scaling Laws
Dan Busbridge, Amitis Shidani, Floris Weers, Jason Ramapuram, Etai Littwin, Russ Webb
•
Feb 12, 2025
•
48
4
Анимация любого персонажа 2: Анимация изображения персонажа высокой точности с учётом окружения
Animate Anyone 2: High-Fidelity Character Image Animation with Environment Affordance
Li Hu, Guangyuan Wang, Zhen Shen, Xin Gao, Dechao Meng, Lian Zhuo, Peng Zhang, Bang Zhang, Liefeng Bo
•
Feb 10, 2025
•
16
4
BenchMAX: Комплексный многоязычный набор оценки для больших языковых моделей
BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models
Xu Huang, Wenhao Zhu, Hanxu Hu, Conghui He, Lei Li, Shujian Huang, Fei Yuan
•
Feb 11, 2025
•
54
2
Медиатор: Слияние LLM с эффективным использованием памяти с меньшим количеством конфликтующих параметров и маршрутизацией на основе неопределенности.
Mediator: Memory-efficient LLM Merging with Less Parameter Conflicts and Uncertainty Based Routing
Kunfeng Lai, Zhenheng Tang, Xinglin Pan, Peijie Dong, Xiang Liu, Haolan Chen, Li Shen, Bo Li, Xiaowen Chu
•
Feb 6, 2025
•
4
2
Прогнозирование следующего блока: генерация видео с помощью полуавторегрессионного моделирования.
Next Block Prediction: Video Generation via Semi-Autoregressive Modeling
Shuhuai Ren, Shuming Ma, Xu Sun, Furu Wei
•
Feb 11, 2025
•
9
2
CineMaster: Фреймворк для генерации видео из текста с учетом 3D и возможностью управления.
CineMaster: A 3D-Aware and Controllable Framework for Cinematic Text-to-Video Generation
Qinghe Wang, Yawen Luo, Xiaoyu Shi, Xu Jia, Huchuan Lu, Tianfan Xue, Xintao Wang, Pengfei Wan, Di Zhang, Kun Gai
•
Feb 12, 2025
•
43
2
NoLiMa: Оценка длинного контекста за пределами прямого сопоставления.
NoLiMa: Long-Context Evaluation Beyond Literal Matching
Ali Modarressi, Hanieh Deilamsalehy, Franck Dernoncourt, Trung Bui, Ryan A. Rossi, Seunghyun Yoon, Hinrich Schütze
•
Feb 7, 2025
•
15
2
Приоритет гомеоморфизма для проблемы ложноположительных и ложноотрицательных результатов в медицинском изображении при обучении плотного контрастного представления.
Homeomorphism Prior for False Positive and Negative Problem in Medical Image Dense Contrastive Representation Learning
Yuting He, Boyu Wang, Rongjun Ge, Yang Chen, Guanyu Yang, Shuo Li
•
Feb 7, 2025
•
0
2
Предварительное обучение LLM с непрерывными концепциями
LLM Pretraining with Continuous Concepts
Jihoon Tack, Jack Lanchantin, Jane Yu, Andrew Cohen, Ilia Kulikov, Janice Lan, Shibo Hao, Yuandong Tian, Jason Weston, Xian Li
•
Feb 12, 2025
•
28
4