ChatPaper.aiChatPaper.ai
Главная

arXiv

HuggingFace

ЦеныАккаунтРабочее пространство

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Ежедневные Исследовательские Статьи по ИИ

Ежедневно отобранные исследовательские статьи по ИИ с переводами

Цепочка обучения моделей для языковой модели
Chain-of-Model Learning for Language Model

Kaitao Song, Xiaohua Wang, Xu Tan, Huiqiang Jiang, Chengruidong Zhang, Yongliang Shen, Cen LU, Zihao Li, Zifan Song, Caihua Shan, Yansen Wang, Kan Ren, Xiaoqing Zheng, Tao Qin, Yuqing Yang, Dongsheng Li, Lili Qiu•May 17, 2025•672

AdaptThink: Модели рассуждений могут научиться, когда нужно думать
AdaptThink: Reasoning Models Can Learn When to Think

Jiajie Zhang, Nianyi Lin, Lei Hou, Ling Feng, Juanzi Li•May 19, 2025•551

AdaCoT: Парето-оптимальное адаптивное управление цепочкой рассуждений с использованием обучения с подкреплением
AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

Chenwei Lou, Zewei Sun, Xinnian Liang, Meng Qu, Wei Shen, Wenqi Wang, Yuntao Li, Qingping Yang, Shuangzhi Wu•May 17, 2025•421

Дельта-внимание: Быстрый и точный вывод разреженного внимания с помощью коррекции дельты
Delta Attention: Fast and Accurate Sparse Attention Inference by Delta Correction

Jeffrey Willette, Heejun Lee, Sung Ju Hwang•May 16, 2025•351

Масштабирование заземления использования компьютера через декомпозицию и синтез пользовательского интерфейса
Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis

Tianbao Xie, Jiaqi Deng, Xiaochuan Li, Junlin Yang, Haoyuan Wu, Jixuan Chen, Wenjing Hu, Xinyuan Wang, Yuhui Xu, Zekun Wang, Yiheng Xu, Junli Wang, Doyen Sahoo, Tao Yu, Caiming Xiong•May 19, 2025•342

Thinkless: ИИ учится, когда думать
Thinkless: LLM Learns When to Think

Gongfan Fang, Xinyin Ma, Xinchao Wang•May 19, 2025•251

Ускорение видео-диффузии с обучаемым разреженным вниманием
Faster Video Diffusion with Trainable Sparse Attention

Peiyuan Zhang, Haofeng Huang, Yongqi Chen, Will Lin, Zhengzhong Liu, Ion Stoica, Eric P. Xing, Hao Zhang•May 19, 2025•231

Поиск в темноте: рассуждения через градиент политики на уровне экземпляров во время тестирования в латентном пространстве
Seek in the Dark: Reasoning via Test-Time Instance-Level Policy Gradient in Latent Space

Hengli Li, Chenxi Li, Tong Wu, Xuekai Zhu, Yuxuan Wang, Zhaoxin Yu, Eric Hanchen Jiang, Song-Chun Zhu, Zixia Jia, Ying Nian Wu, Zilong Zheng•May 19, 2025•233

Слияние моделей в предварительном обучении больших языковых моделей
Model Merging in Pre-training of Large Language Models

Yunshui Li, Yiyuan Ma, Shen Yan, Chaoyi Zhang, Jing Liu, Jianqiao Lu, Ziwen Xu, Mengzhao Chen, Minrui Wang, Shiyi Zhan, Jin Ma, Xunhao Lai, Yao Luo, Xingyan Bin, Hongbin Ren, Mingji Han, Wenhao Hao, Bairen Yi, LingJun Liu, Bole Ma, Xiaoying Jia, Zhou Xun, Liang Xiang, Yonghui Wu•May 17, 2025•234

MM-PRM: Улучшение мультимодального математического рассуждения с помощью масштабируемого пошагового контроля
MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision

Lingxiao Du, Fanqing Meng, Zongkai Liu, Zhixiang Zhou, Ping Luo, Qiaosheng Zhang, Wenqi Shao•May 19, 2025•201

Гибридный метод 3D-4D гауссовых сплатов для быстрого представления динамических сцен
Hybrid 3D-4D Gaussian Splatting for Fast Dynamic Scene Representation

Seungjun Oh, Younggeun Lee, Hyejin Jeon, Eunbyung Park•May 19, 2025•201

FedSVD: Адаптивная ортогонализация для приватного федеративного обучения с использованием LoRA
FedSVD: Adaptive Orthogonalization for Private Federated Learning with LoRA

Seanie Lee, Sangwoo Park, Dong Bok Lee, Dominik Wagner, Haebin Seong, Tobias Bocklet, Juho Lee, Sung Ju Hwang•May 19, 2025•202

CPGD: В направлении стабильного обучения с подкреплением на основе правил для языковых моделей
CPGD: Toward Stable Rule-based Reinforcement Learning for Language Models

Zongkai Liu, Fanqing Meng, Lingxiao Du, Zhixiang Zhou, Chao Yu, Wenqi Shao, Qiaosheng Zhang•May 18, 2025•201

Фрагментированное цепочечное рассуждение
Fractured Chain-of-Thought Reasoning

Baohao Liao, Hanze Dong, Yuhui Xu, Doyen Sahoo, Christof Monz, Junnan Li, Caiming Xiong•May 19, 2025•161

ChartMuseum: Тестирование способностей к визуальному анализу крупных мультимодальных моделей
ChartMuseum: Testing Visual Reasoning Capabilities of Large Vision-Language Models

Liyan Tang, Grace Kim, Xinyu Zhao, Thom Lake, Wenxuan Ding, Fangcong Yin, Prasann Singhal, Manya Wadhwa, Zeyu Leo Liu, Zayne Sprague, Ramya Namuduri, Bodun Hu, Juan Diego Rodriguez, Puyuan Peng, Greg Durrett•May 19, 2025•142

Нейро-символьный компилятор запросов
Neuro-Symbolic Query Compiler

Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen•May 17, 2025•142

SEED-GRPO: Семантическая энтропия в GRPO для оптимизации стратегий с учетом неопределенности
SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Minghan Chen, Guikun Chen, Wenguan Wang, Yi Yang•May 18, 2025•132

VisionReasoner: Единая система визуального восприятия и логического вывода с использованием обучения с подкреплением
VisionReasoner: Unified Visual Perception and Reasoning via Reinforcement Learning

Yuqi Liu, Tianyuan Qu, Zhisheng Zhong, Bohao Peng, Shu Liu, Bei Yu, Jiaya Jia•May 17, 2025•131

За зеркалом: оценка согласованности здравого смысла для странных изображений
Through the Looking Glass: Common Sense Consistency Evaluation of Weird Images

Elisei Rykov, Kseniia Petrushina, Kseniia Titova, Anton Razzhigaev, Alexander Panchenko, Vasily Konovalov•May 12, 2025•122

ViPlan: Бенчмарк для визуального планирования с использованием символических предикатов и моделей, объединяющих зрение и язык
ViPlan: A Benchmark for Visual Planning with Symbolic Predicates and Vision-Language Models

Matteo Merler, Nicola Dainese, Minttu Alakuijala, Giovanni Bonetta, Pietro Ferrazzi, Yu Tian, Bernardo Magnini, Pekka Marttinen•May 19, 2025•111

Когда ИИ-соучёные ошибаются: SPOT — эталон для автоматизированной проверки научных исследований
When AI Co-Scientists Fail: SPOT-a Benchmark for Automated Verification of Scientific Research

Guijin Son, Jiwoo Hong, Honglu Fan, Heejeong Nam, Hyunwoo Ko, Seungwon Lim, Jinyeop Song, Jinha Choi, Gonçalo Paulo, Youngjae Yu, Stella Biderman•May 17, 2025•81

Ускорение выборки TarFlow с использованием итерации GS-Jacobi
Accelerate TarFlow Sampling with GS-Jacobi Iteration

Ben Liu, Zhen Qin•May 19, 2025•71

Tiny QA Benchmark++: Сверхлегкий синтетический мультиязычный набор данных для генерации и экспресс-тестирования непрерывной оценки языковых моделей
Tiny QA Benchmark++: Ultra-Lightweight, Synthetic Multilingual Dataset Generation & Smoke-Tests for Continuous LLM Evaluation

Vincent Koc•May 17, 2025•62

R3: Робастные модели вознаграждения, независимые от рубрик
R3: Robust Rubric-Agnostic Reward Models

David Anugraha, Zilu Tang, Lester James V. Miranda, Hanyang Zhao, Mohammad Rifqi Farhansyah, Garry Kuwanto, Derry Wijaya, Genta Indra Winata•May 19, 2025•51

FinePhys: Генерация детализированных действий человека с явным учетом физических законов для эффективного управления скелетной структурой
FinePhys: Fine-grained Human Action Generation by Explicitly Incorporating Physical Laws for Effective Skeletal Guidance

Dian Shao, Mingfei Shi, Shengda Xu, Haodong Chen, Yongle Huang, Binglu Wang•May 19, 2025•41

MTVCrafter: Токенизация 4D-движений для анимации изображений человека в открытом мире
MTVCrafter: 4D Motion Tokenization for Open-World Human Image Animation

Yanbo Ding, Xirui Hu, Zhizhi Guo, Yali Wang•May 15, 2025•41

ExTrans: Многоязычный перевод с глубоким логическим выводом через обучение с подкреплением, усиленное примерами
ExTrans: Multilingual Deep Reasoning Translation via Exemplar-Enhanced Reinforcement Learning

Jiaan Wang, Fandong Meng, Jie Zhou•May 19, 2025•31

HISTAI: Открытый набор данных крупномасштабных изображений целых срезов для вычислительной патологии
HISTAI: An Open-Source, Large-Scale Whole Slide Image Dataset for Computational Pathology

Dmitry Nechaev, Alexey Pchelnikov, Ekaterina Ivanova•May 17, 2025•31

QVGen: Расширение границ квантованных генеративных моделей для видео
QVGen: Pushing the Limit of Quantized Video Generative Models

Yushi Huang, Ruihao Gong, Jing Liu, Yifu Ding, Chengtao Lv, Haotong Qin, Jun Zhang•May 16, 2025•31

SoftCoT++: Масштабирование во время тестирования с использованием мягкого цепочечного рассуждения
SoftCoT++: Test-Time Scaling with Soft Chain-of-Thought Reasoning

Yige Xu, Xu Guo, Zhiwei Zeng, Chunyan Miao•May 16, 2025•31

От звуков к грамматике: возникновение языка в процессе совместного поиска ресурсов
From Grunts to Grammar: Emergent Language from Cooperative Foraging

Maytus Piriyajitakonkij, Rujikorn Charakorn, Weicheng Tao, Wei Pan, Mingfei Sun, Cheston Tan, Mengmi Zhang•May 19, 2025•21

HelpSteer3-Preference: Открытые данные о предпочтениях, аннотированные людьми, для разнообразных задач и языков
HelpSteer3-Preference: Open Human-Annotated Preference Data across Diverse Tasks and Languages

Zhilin Wang, Jiaqi Zeng, Olivier Delalleau, Hoo-Chang Shin, Felipe Soares, Alexander Bukharin, Ellie Evans, Yi Dong, Oleksii Kuchaiev•May 16, 2025•21

Один токен стоит более тысячи токенов: эффективное дистилляция знаний через низкоранговое клонирование
A Token is Worth over 1,000 Tokens: Efficient Knowledge Distillation through Low-Rank Clone

Jitai Hao, Qiang Huang, Hao Liu, Xinyan Xiao, Zhaochun Ren, Jun Yu•May 19, 2025•11

Кондиционирование контекста LLM и PWP-подсказки для мультимодальной валидации химических формул
LLM Context Conditioning and PWP Prompting for Multimodal Validation of Chemical Formulas

Evgeny Markhasin•May 18, 2025•11

TechniqueRAG: Генерация с усилением поиска для аннотирования методов атак в текстах киберугроз
TechniqueRAG: Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text

Ahmed Lekssays, Utsav Shukla, Husrev Taha Sencar, Md Rizwan Parvez•May 17, 2025•11

Обученный облегченный смартфонный ISP с использованием несопоставленных данных
Learned Lightweight Smartphone ISP with Unpaired Data

Andrei Arhire, Radu Timofte•May 15, 2025•11

Автоматизированное научное рецензирование на основе ИИ с использованием устойчивого пошагового запроса, мета-запросов и мета-рассуждений
AI-Driven Scholarly Peer Review via Persistent Workflow Prompting, Meta-Prompting, and Meta-Reasoning

Evgeny Markhasin•May 6, 2025•11

Быстро, а не вычурно: переосмысление G2P с использованием богатых данных и моделей на основе правил
Fast, Not Fancy: Rethinking G2P with Rich Data and Rule-Based Models

Mahta Fetrat Qharabagh, Zahra Dehghanian, Hamid R. Rabiee•May 19, 2025•01

Создание общих моделей пользователей на основе использования компьютера
Creating General User Models from Computer Use

Omar Shaikh, Shardul Sapkota, Shan Rizvi, Eric Horvitz, Joon Sung Park, Diyi Yang, Michael S. Bernstein•May 16, 2025•01