Ежедневные статьи
За пределами "Эврики!": К систематическому согласованию метаспособностей в крупных моделях рассужденийBeyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large
Reasoning Models
За пределами "Эврики!": К систематическому согласованию метаспособностей в крупных моделях рассуждений
Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large
Reasoning Models
Zhiyuan Hu, Yibo Wang, Hanze Dong, Yuhui Xu, Amrita Saha, Caiming Xiong, Bryan Hooi, Junnan Li•May 15, 2025•973
Закон масштабирования для языковых моделей при параллельных вычисленияхParallel Scaling Law for Language Models
Закон масштабирования для языковых моделей при параллельных вычислениях
Parallel Scaling Law for Language Models
Mouxiang Chen, Binyuan Hui, Zeyu Cui, Jiaxi Yang, Dayiheng Liu, Jianling Sun, Junyang Lin, Zhongxin Liu•May 15, 2025•563
Оптимизация системных промптов с использованием метаобученияSystem Prompt Optimization with Meta-Learning
Оптимизация системных промптов с использованием метаобучения
System Prompt Optimization with Meta-Learning
Yumin Choi, Jinheon Baek, Sung Ju Hwang•May 14, 2025•533
OpenThinkIMG: Обучение мышлению с помощью изображений через визуальный инструмент с использованием обучения с подкреплениемOpenThinkIMG: Learning to Think with Images via Visual Tool
Reinforcement Learning
OpenThinkIMG: Обучение мышлению с помощью изображений через визуальный инструмент с использованием обучения с подкреплением
OpenThinkIMG: Learning to Think with Images via Visual Tool
Reinforcement Learning
Zhaochen Su, Linjie Li, Mingyang Song, Yunzhuo Hao, Zhengyuan Yang, Jun Zhang, Guanjie Chen, Jiawei Gu, Juntao Li, Xiaoye Qu, Yu Cheng•May 13, 2025•293
EnerVerse-AC: Визуализация воплощённых сред с условиями действийEnerVerse-AC: Envisioning Embodied Environments with Action Condition
EnerVerse-AC: Визуализация воплощённых сред с условиями действий
EnerVerse-AC: Envisioning Embodied Environments with Action Condition
Yuxin Jiang, Shengcong Chen, Siyuan Huang, Liliang Chen, Pengfei Zhou, Yue Liao, Xindong He, Chiming Liu, Hongsheng Li, Maoqing Yao, Guanghui Ren•May 14, 2025•182
Тонкая настройка сквозного токенизатора для компьютерного зренияEnd-to-End Vision Tokenizer Tuning
Тонкая настройка сквозного токенизатора для компьютерного зрения
End-to-End Vision Tokenizer Tuning
Wenxuan Wang, Fan Zhang, Yufeng Cui, Haiwen Diao, Zhuoyan Luo, Huchuan Lu, Jing Liu, Xinlong Wang•May 15, 2025•173
WorldPM: Масштабирование моделирования человеческих предпочтенийWorldPM: Scaling Human Preference Modeling
WorldPM: Масштабирование моделирования человеческих предпочтений
WorldPM: Scaling Human Preference Modeling
Binghai Wang, Runji Lin, Keming Lu, Le Yu, Zhenru Zhang, Fei Huang, Chujie Zheng, Kai Dang, Yang Fan, Xingzhang Ren, An Yang, Binyuan Hui, Dayiheng Liu, Tao Gui, Qi Zhang, Xuanjing Huang, Yu-Gang Jiang, Bowen Yu, Jingren Zhou, Junyang Lin•May 15, 2025•172
Энциклопедия CoT: анализ, прогнозирование и управление процессом мышления модели рассужденийThe CoT Encyclopedia: Analyzing, Predicting, and Controlling how a
Reasoning Model will Think
Энциклопедия CoT: анализ, прогнозирование и управление процессом мышления модели рассуждений
The CoT Encyclopedia: Analyzing, Predicting, and Controlling how a
Reasoning Model will Think
Seongyun Lee, Seungone Kim, Minju Seo, Yongrae Jo, Dongyoung Go, Hyeonbin Hwang, Jinho Park, Xiang Yue, Sean Welleck, Graham Neubig, Moontae Lee, Minjoon Seo•May 15, 2025•172
EWMBench: Оценка качества сцены, движения и семантики в воплощённых моделях мираEWMBench: Evaluating Scene, Motion, and Semantic Quality in Embodied
World Models
EWMBench: Оценка качества сцены, движения и семантики в воплощённых моделях мира
EWMBench: Evaluating Scene, Motion, and Semantic Quality in Embodied
World Models
Hu Yue, Siyuan Huang, Yue Liao, Shengcong Chen, Pengfei Zhou, Liliang Chen, Maoqing Yao, Guanghui Ren•May 14, 2025•162
J1: Стимулирование мышления в LLM-как-судье с помощью обучения с подкреплениемJ1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning
J1: Стимулирование мышления в LLM-как-судье с помощью обучения с подкреплением
J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning
Chenxi Whitehouse, Tianlu Wang, Ping Yu, Xian Li, Jason Weston, Ilia Kulikov, Swarnadeep Saha•May 15, 2025•152
MLE-Dojo: Интерактивные среды для расширения возможностей агентов на основе больших языковых моделей в области инженерии машинного обученияMLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine
Learning Engineering
MLE-Dojo: Интерактивные среды для расширения возможностей агентов на основе больших языковых моделей в области инженерии машинного обучения
MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine
Learning Engineering
Rushi Qiang, Yuchen Zhuang, Yinghao Li, Dingu Sagar V K, Rongzhi Zhang, Changhao Li, Ian Shu-Hei Wong, Sherry Yang, Percy Liang, Chao Zhang, Bo Dai•May 12, 2025•152
Unilogit: Робастное машинное «забывание» для крупных языковых моделей с использованием само-дистилляции с равномерной цельюUnilogit: Robust Machine Unlearning for LLMs Using Uniform-Target
Self-Distillation
Unilogit: Робастное машинное «забывание» для крупных языковых моделей с использованием само-дистилляции с равномерной целью
Unilogit: Robust Machine Unlearning for LLMs Using Uniform-Target
Self-Distillation
Stefan Vasilev, Christian Herold, Baohao Liao, Seyyed Hadi Hashemi, Shahram Khadivi, Christof Monz•May 9, 2025•152
Настройка стиля в генерации текста в вектор с использованием априорных знаний о диффузии изображенийStyle Customization of Text-to-Vector Generation with Image Diffusion
Priors
Настройка стиля в генерации текста в вектор с использованием априорных знаний о диффузии изображений
Style Customization of Text-to-Vector Generation with Image Diffusion
Priors
Peiying Zhang, Nanxuan Zhao, Jing Liao•May 15, 2025•143
Глубина Anything с любым априорным знаниемDepth Anything with Any Prior
Глубина Anything с любым априорным знанием
Depth Anything with Any Prior
Zehan Wang, Siyu Chen, Lihe Yang, Jialei Wang, Ziang Zhang, Hengshuang Zhao, Zhou Zhao•May 15, 2025•112
PointArena: Исследование мультимодальной привязки через указание, управляемое языкомPointArena: Probing Multimodal Grounding Through Language-Guided
Pointing
PointArena: Исследование мультимодальной привязки через указание, управляемое языком
PointArena: Probing Multimodal Grounding Through Language-Guided
Pointing
Long Cheng, Jiafei Duan, Yi Ru Wang, Haoquan Fang, Boyang Li, Yushan Huang, Elvis Wang, Ainaz Eftekhar, Jason Lee, Wentao Yuan, Rose Hendrix, Noah A. Smith, Fei Xia, Dieter Fox, Ranjay Krishna•May 15, 2025•112
Исследование глубокого слияния крупных языковых моделей и диффузионных трансформаторов для синтеза изображений по текстуExploring the Deep Fusion of Large Language Models and Diffusion
Transformers for Text-to-Image Synthesis
Исследование глубокого слияния крупных языковых моделей и диффузионных трансформаторов для синтеза изображений по тексту
Exploring the Deep Fusion of Large Language Models and Diffusion
Transformers for Text-to-Image Synthesis
Bingda Tang, Boyang Zheng, Xichen Pan, Sayak Paul, Saining Xie•May 15, 2025•102
Достижение гибкости токенизатора в языковых моделях посредством эвристической адаптации и обучения супертокеновAchieving Tokenizer Flexibility in Language Models through Heuristic
Adaptation and Supertoken Learning
Достижение гибкости токенизатора в языковых моделях посредством эвристической адаптации и обучения супертокенов
Achieving Tokenizer Flexibility in Language Models through Heuristic
Adaptation and Supertoken Learning
Shaurya Sharthak, Vinayak Pahalwan, Adithya Kamath, Adarsh Shirawalmath•May 14, 2025•92
3D-Fixup: Усовершенствование редактирования фотографий с использованием 3D-приоритетов3D-Fixup: Advancing Photo Editing with 3D Priors
3D-Fixup: Усовершенствование редактирования фотографий с использованием 3D-приоритетов
3D-Fixup: Advancing Photo Editing with 3D Priors
Yen-Chi Cheng, Krishna Kumar Singh, Jae Shin Yoon, Alex Schwing, Liangyan Gui, Matheus Gadelha, Paul Guerrero, Nanxuan Zhao•May 15, 2025•82
ИИ-агенты и агентный ИИ: концептуальная таксономия, приложения и вызовыAI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and
Challenge
ИИ-агенты и агентный ИИ: концептуальная таксономия, приложения и вызовы
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and
Challenge
Ranjan Sapkota, Konstantinos I. Roumeliotis, Manoj Karkee•May 15, 2025•72
ReSurgSAM2: Сегментация объектов в хирургическом видео с использованием достоверного долгосрочного отслеживанияReSurgSAM2: Referring Segment Anything in Surgical Video via Credible
Long-term Tracking
ReSurgSAM2: Сегментация объектов в хирургическом видео с использованием достоверного долгосрочного отслеживания
ReSurgSAM2: Referring Segment Anything in Surgical Video via Credible
Long-term Tracking
Haofeng Liu, Mingqi Gao, Xuxiao Luo, Ziyue Wang, Guanyi Qin, Junde Wu, Yueming Jin•May 13, 2025•72
QuXAI: Интерпретаторы для гибридных моделей квантового машинного обученияQuXAI: Explainers for Hybrid Quantum Machine Learning Models
QuXAI: Интерпретаторы для гибридных моделей квантового машинного обучения
QuXAI: Explainers for Hybrid Quantum Machine Learning Models
Saikat Barua, Mostafizur Rahman, Shehenaz Khaled, Md Jafor Sadek, Rafiul Islam, Shahnewaz Siddique•May 15, 2025•53
AdaptCLIP: Адаптация CLIP для универсального обнаружения визуальных аномалийAdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection
AdaptCLIP: Адаптация CLIP для универсального обнаружения визуальных аномалий
AdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection
Bin-Bin Gao, Yue Zhu, Jiangtao Yan, Yuezhi Cai, Weixi Zhang, Meng Wang, Jun Liu, Yong Liu, Lei Wang, Chengjie Wang•May 15, 2025•54
Real2Render2Real: Масштабирование данных для роботов без использования симуляции динамики или роботизированного оборудованияReal2Render2Real: Scaling Robot Data Without Dynamics Simulation or
Robot Hardware
Real2Render2Real: Масштабирование данных для роботов без использования симуляции динамики или роботизированного оборудования
Real2Render2Real: Scaling Robot Data Without Dynamics Simulation or
Robot Hardware
Justin Yu, Letian Fu, Huang Huang, Karim El-Refai, Rares Andrei Ambrus, Richard Cheng, Muhammad Zubair Irshad, Ken Goldberg•May 14, 2025•42
Генерация на основе аномалий с использованием малого числа примеров для классификации и сегментации аномалийFew-Shot Anomaly-Driven Generation for Anomaly Classification and
Segmentation
Генерация на основе аномалий с использованием малого числа примеров для классификации и сегментации аномалий
Few-Shot Anomaly-Driven Generation for Anomaly Classification and
Segmentation
Guan Gui, Bin-Bin Gao, Jun Liu, Chengjie Wang, Yunsheng Wu•May 14, 2025•42
X-Sim: Межматериальное обучение через подход "реальное-к-симуляции-к-реальному"X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real
X-Sim: Межматериальное обучение через подход "реальное-к-симуляции-к-реальному"
X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real
Prithwish Dan, Kushal Kedia, Angela Chao, Edward Weiyi Duan, Maximus Adrian Pace, Wei-Chiu Ma, Sanjiban Choudhury•May 11, 2025•32