ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
February 21st, 2025
AlphaMaze: Улучшение пространственного интеллекта крупных языковых моделей с помощью GRPO
AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO
Alan Dao, Dinh Bach Vu
•
Feb 20, 2025
•
14
2
Сколько знаний можно упаковать в адаптер LoRA, не навредив языковой модели?
How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?
Sergey Pletenev, Maria Marina, Daniil Moskovskiy, Vasily Konovalov, Pavel Braslavski, Alexander Panchenko, Mikhail Salnikov
•
Feb 20, 2025
•
91
9
Геолокация на основе реальных игровых данных: крупномасштабный набор данных и фреймворк для человеко-подобного рассуждения
Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework
Zirui Song, Jingpu Yang, Yuan Huang, Jonathan Tonglet, Zeyu Zhang, Tao Cheng, Meng Fang, Iryna Gurevych, Xiuying Chen
•
Feb 19, 2025
•
4
2
Logic-RL: Раскрытие способностей к рассуждению в больших языковых моделях с помощью обучения с подкреплением на основе правил
Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning
Tian Xie, Zitian Gao, Qingnan Ren, Haoming Luo, Yuqian Hong, Bryan Dai, Joey Zhou, Kai Qiu, Zhirong Wu, Chong Luo
•
Feb 20, 2025
•
48
5
Генерация π-функциональных молекул с использованием STGG+ и активного обучения
Generating π-Functional Molecules Using STGG+ with Active Learning
Alexia Jolicoeur-Martineau, Yan Zhang, Boris Knyazev, Aristide Baratin, Cheng-Hao Liu
•
Feb 20, 2025
•
4
2
Масштабирование понимания текстово-насыщенных изображений с помощью генерации синтетических мультимодальных данных на основе кода
Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation
Yue Yang, Ajay Patel, Matt Deitke, Tanmay Gupta, Luca Weihs, Andrew Head, Mark Yatskar, Chris Callison-Burch, Ranjay Krishna, Aniruddha Kembhavi, Christopher Clark
•
Feb 20, 2025
•
13
2
LongWriter-V: Обеспечение сверхдлинной и высококачественной генерации в моделях, объединяющих зрение и язык
LongWriter-V: Enabling Ultra-Long and High-Fidelity Generation in Vision-Language Models
Shangqing Tu, Yucheng Wang, Daniel Zhang-Li, Yushi Bai, Jifan Yu, Yuhao Wu, Lei Hou, Huiqin Liu, Zhiyuan Liu, Bin Xu, Juanzi Li
•
Feb 20, 2025
•
24
2
Улучшение когнитивных способностей и объяснимости мультимодальных базовых моделей с использованием самостоятельно синтезированных данных
Enhancing Cognition and Explainability of Multimodal Foundation Models with Self-Synthesized Data
Yucheng Shi, Quanzheng Li, Jin Sun, Xiang Li, Ninghao Liu
•
Feb 19, 2025
•
8
3
CLIPPER: Сжатие данных позволяет генерировать синтетические данные с длинным контекстом
CLIPPER: Compression enables long-context synthetic data generation
Chau Minh Pham, Yapei Chang, Mohit Iyyer
•
Feb 20, 2025
•
8
2
Насколько часто языковые модели галлюцинируют на разных языках? Оценка галлюцинаций языковых моделей в мультиязычной среде
How Much Do LLMs Hallucinate across Languages? On Multilingual Estimation of LLM Hallucination in the Wild
Saad Obaid ul Islam, Anne Lauscher, Goran Glavaš
•
Feb 18, 2025
•
3
2
Имеет ли время свое место? Временные головы: где языковые модели запоминают временно-специфическую информацию
Does Time Have Its Place? Temporal Heads: Where Language Models Recall Time-specific Information
Yein Park, Chanwoong Yoon, Jungwoo Park, Minbyul Jeong, Jaewoo Kang
•
Feb 20, 2025
•
26
2
Управление пользовательскими профилями на основе языковых моделей для рекомендательных систем
LLM-based User Profile Management for Recommender System
Seunghwan Bang, Hwanjun Song
•
Feb 20, 2025
•
6
2
SigLIP 2: Многоязычные кодировщики для обработки изображений и текста с улучшенным семантическим пониманием, локализацией и плотными признаками
SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features
Michael Tschannen, Alexey Gritsenko, Xiao Wang, Muhammad Ferjad Naeem, Ibrahim Alabdulmohsin, Nikhil Parthasarathy, Talfan Evans, Lucas Beyer, Ye Xia, Basil Mustafa, Olivier Hénaff, Jeremiah Harmsen, Andreas Steiner, Xiaohua Zhai
•
Feb 20, 2025
•
143
7
NAVIG: Анализ с использованием моделей "визуальный язык" с управлением на естественном языке для геолокации изображений
NAVIG: Natural Language-guided Analysis with Vision Language Models for Image Geo-localization
Zheyuan Zhang, Runze Li, Tasnim Kabir, Jordan Boyd-Graber
•
Feb 20, 2025
•
11
2
Персонализация динамических концепций на основе одиночных видео
Dynamic Concepts Personalization from Single Videos
Rameen Abdal, Or Patashnik, Ivan Skorokhodov, Willi Menapace, Aliaksandr Siarohin, Sergey Tulyakov, Daniel Cohen-Or, Kfir Aberman
•
Feb 20, 2025
•
16
2
Атрибуция неструктурированных данных для контекстно-зависимого суммаризации с длинным контекстом
Unstructured Evidence Attribution for Long Context Query Focused Summarization
Dustin Wright, Zain Muhammad Mujahid, Lu Wang, Isabelle Augenstein, David Jurgens
•
Feb 20, 2025
•
3
2
Как заставить вашу языковую модель генерировать сложные задачи для оценки
How to Get Your LLM to Generate Challenging Problems for Evaluation
Arkil Patel, Siva Reddy, Dzmitry Bahdanau
•
Feb 20, 2025
•
17
2
PC-Agent: Иерархическая структура многозадачного взаимодействия агентов для автоматизации сложных задач на ПК
PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC
Haowei Liu, Xi Zhang, Haiyang Xu, Yuyang Wanyan, Junyang Wang, Ming Yan, Ji Zhang, Chunfeng Yuan, Changsheng Xu, Weiming Hu, Fei Huang
•
Feb 20, 2025
•
20
3
S^2R: Обучение крупных языковых моделей самопроверке и самокоррекции с использованием обучения с подкреплением
S^2R: Teaching LLMs to Self-verify and Self-correct via Reinforcement Learning
Ruotian Ma, Peisong Wang, Cheng Liu, Xingyan Liu, Jiaqi Chen, Bang Zhang, Xin Zhou, Nan Du, Jia Li
•
Feb 18, 2025
•
29
2
Генерация наборов данных Skyline для моделей науки о данных
Generating Skyline Datasets for Data Science Models
Mengying Wang, Hanchao Ma, Yiyang Bian, Yangxin Fan, Yinghui Wu
•
Feb 16, 2025
•
7
2
SuperGPQA: Масштабирование оценки языковых моделей в 285 аспирантских дисциплинах
SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines
M-A-P Team, Xinrun Du, Yifan Yao, Kaijing Ma, Bingli Wang, Tianyu Zheng, Kang Zhu, Minghao Liu, Yiming Liang, Xiaolong Jin, Zhenlin Wei, Chujie Zheng, Kaixing Deng, Shuyue Guo, Shian Jia, Sichao Jiang, Yiyan Liao, Rui Li, Qinrui Li, Sirun Li, Yizhi Li, Yunwen Li, Dehua Ma, Yuansheng Ni, Haoran Que, Qiyao Wang, Zhoufutu Wen, Siwei Wu, Tianshun Xing, Ming Xu, Zhenzhu Yang, Zekun Moore Wang, Junting Zhou, Yuelin Bai, Xingyuan Bu, Chenglin Cai, Liang Chen, Yifan Chen, Chengtuo Cheng, Tianhao Cheng, Keyi Ding, Siming Huang, Yun Huang, Yaoru Li, Yizhe Li, Zhaoqun Li, Tianhao Liang, Chengdong Lin, Hongquan Lin, Yinghao Ma, Zhongyuan Peng, Zifan Peng, Qige Qi, Shi Qiu, Xingwei Qu, Yizhou Tan, Zili Wang, Chenqing Wang, Hao Wang, Yiya Wang, Yubo Wang, Jiajun Xu, Kexin Yang, Ruibin Yuan, Yuanhao Yue, Tianyang Zhan, Chun Zhang, Jingyang Zhang, Xiyue Zhang, Xingjian Zhang, Yue Zhang, Yongchi Zhao, Xiangyu Zheng, Chenghua Zhong, Yang Gao, Zhoujun Li, Dayiheng Liu, Qian Liu, Tianyu Liu, Shiwen Ni, Junran Peng, Yujia Qin, Wenbo Su, Guoyin Wang, Shi Wang, Jian Yang, Min Yang, Meng Cao, Xiang Yue, Zhaoxiang Zhang, Wangchunshu Zhou, Jiaheng Liu, Qunshu Lin, Wenhao Huang, Ge Zhang
•
Feb 20, 2025
•
103
10
Multimodal RewardBench: Комплексная оценка моделей вознаграждения для мультимодальных моделей "визуальный язык"
Multimodal RewardBench: Holistic Evaluation of Reward Models for Vision Language Models
Michihiro Yasunaga, Luke Zettlemoyer, Marjan Ghazvininejad
•
Feb 20, 2025
•
7
2
LServe: Эффективное обслуживание длинных последовательностей в LLM с использованием унифицированного разреженного внимания
LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention
Shang Yang, Junxian Guo, Haotian Tang, Qinghao Hu, Guangxuan Xiao, Jiaming Tang, Yujun Lin, Zhijian Liu, Yao Lu, Song Han
•
Feb 20, 2025
•
13
2
S*: Масштабирование во время тестирования для генерации кода
S*: Test Time Scaling for Code Generation
Dacheng Li, Shiyi Cao, Chengkun Cao, Xiuyu Li, Shangyin Tan, Kurt Keutzer, Jiarong Xing, Joseph E. Gonzalez, Ion Stoica
•
Feb 20, 2025
•
63
3
От RAG к памяти: непараметрическое непрерывное обучение для больших языковых моделей
From RAG to Memory: Non-Parametric Continual Learning for Large Language Models
Bernal Jiménez Gutiérrez, Yiheng Shu, Weijian Qi, Sizhe Zhou, Yu Su
•
Feb 20, 2025
•
13
2
Симметричная визуальная контрастная оптимизация: согласование моделей "визуальный язык" с минимальным количеством контрастных изображений
Symmetrical Visual Contrastive Optimization: Aligning Vision-Language Models with Minimal Contrastive Images
Shengguang Wu, Fan-Yun Sun, Kaiyue Wen, Nick Haber
•
Feb 19, 2025
•
4
2
Открытие высокоэффективных квантовых кодов с малой массой для коррекции ошибок с использованием обучения с подкреплением
Discovering highly efficient low-weight quantum error-correcting codes with reinforcement learning
Austin Yubo He, Zi-Wen Liu
•
Feb 20, 2025
•
36
4
RelaCtrl: Эффективное управление на основе релевантности для диффузионных трансформеров
RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers
Ke Cao, Jing Wang, Ao Ma, Jiasong Feng, Zhanjie Zhang, Xuanhua He, Shanyuan Liu, Bo Cheng, Dawei Leng, Yuhui Yin, Jie Zhang
•
Feb 20, 2025
•
12
2
MLGym: Новый фреймворк и бенчмарк для продвижения исследовательских агентов в области ИИ
MLGym: A New Framework and Benchmark for Advancing AI Research Agents
Deepak Nathani, Lovish Madaan, Nicholas Roberts, Nikolay Bashlykov, Ajay Menon, Vincent Moens, Amar Budhiraja, Despoina Magka, Vladislav Vorotilov, Gaurav Chaurasia, Dieuwke Hupkes, Ricardo Silveira Cabral, Tatiana Shavrina, Jakob Foerster, Yoram Bachrach, William Yang Wang, Roberta Raileanu
•
Feb 20, 2025
•
192
3