ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
May 9th, 2025
Восприятие, Рассуждение, Мышление и Планирование: Обзор крупномасштабных мультимодальных моделей рассуждений
Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models
Yunxin Li, Zhenyu Liu, Zitao Li, Xuanyu Zhang, Zhenran Xu, Xinyu Chen, Haoyuan Shi, Shenyuan Jiang, Xintong Wang, Jifang Wang, Shouzheng Huang, Xinping Zhao, Borui Jiang, Lanqing Hong, Longyue Wang, Zhuotao Tian, Baoxing Huai, Wenhan Luo, Weihua Luo, Zheng Zhang, Baotian Hu, Min Zhang
•
May 8, 2025
•
74
1
Flow-GRPO: Обучение моделей Flow Matching с использованием онлайн-обучения с подкреплением
Flow-GRPO: Training Flow Matching Models via Online RL
Jie Liu, Gongye Liu, Jiajun Liang, Yangguang Li, Jiaheng Liu, Xintao Wang, Pengfei Wan, Di Zhang, Wanli Ouyang
•
May 8, 2025
•
34
2
Масштабируемая цепочка рассуждений через эластичное мышление
Scalable Chain of Thoughts via Elastic Reasoning
Yuhui Xu, Hanze Dong, Lei Wang, Doyen Sahoo, Junnan Li, Caiming Xiong
•
May 8, 2025
•
16
1
Сентиентный агент как судья: оценка социального познания высшего порядка в крупных языковых моделях
Sentient Agent as a Judge: Evaluating Higher-Order Social Cognition in Large Language Models
Bang Zhang, Ruotian Ma, Qingxuan Jiang, Peisong Wang, Jiaqi Chen, Zheng Xie, Xingyu Chen, Yue Wang, Fanghua Ye, Jian Li, Yifan Yang, Zhaopeng Tu, Xiaolong Li
•
May 1, 2025
•
16
3
Генерация 3D-сцен: Обзор
3D Scene Generation: A Survey
Beichen Wen, Haozhe Xie, Zhaoxi Chen, Fangzhou Hong, Ziwei Liu
•
May 8, 2025
•
10
1
FG-CLIP: Точное согласование визуальных и текстовых данных на детальном уровне
FG-CLIP: Fine-Grained Visual and Textual Alignment
Chunyu Xie, Bin Wang, Fanjing Kong, Jincheng Li, Dawei Liang, Gengshen Zhang, Dawei Leng, Yuhui Yin
•
May 8, 2025
•
10
1
ICon: Вклад в контексте для автоматического выбора данных
ICon: In-Context Contribution for Automatic Data Selection
Yixin Yang, Qingxiu Dong, Linli Yao, Fangwei Zhu, Zhifang Sui
•
May 8, 2025
•
9
1
X-Reasoner: К универсальным рассуждениям через модальности и области
X-Reasoner: Towards Generalizable Reasoning Across Modalities and Domains
Qianchu Liu, Sheng Zhang, Guanghui Qin, Timothy Ossowski, Yu Gu, Ying Jin, Sid Kiblawi, Sam Preston, Mu Wei, Paul Vozila, Tristan Naumann, Hoifung Poon
•
May 6, 2025
•
8
2
Создание физически устойчивых и реализуемых конструкций LEGO из текста
Generating Physically Stable and Buildable LEGO Designs from Text
Ava Pun, Kangle Deng, Ruixuan Liu, Deva Ramanan, Changliu Liu, Jun-Yan Zhu
•
May 8, 2025
•
7
1
StreamBridge: Превращение вашей автономной видео-модели большого языка в активного потокового помощника
StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming Assistant
Haibo Wang, Bo Feng, Zhengfeng Lai, Mingze Xu, Shiyu Li, Weifeng Ge, Afshin Dehghan, Meng Cao, Ping Huang
•
May 8, 2025
•
7
1
LiftFeat: Сопоставление локальных признаков с учетом 3D-геометрии
LiftFeat: 3D Geometry-Aware Local Feature Matching
Yepeng Liu, Wenpeng Lai, Zhou Zhao, Yuxuan Xiong, Jinchi Zhu, Jun Cheng, Yongchao Xu
•
May 6, 2025
•
6
1
Межъязыковое рассуждение через масштабирование во время тестирования
Crosslingual Reasoning through Test-Time Scaling
Zheng-Xin Yong, M. Farid Adilazuarda, Jonibek Mansurov, Ruochen Zhang, Niklas Muennighoff, Carsten Eickhoff, Genta Indra Winata, Julia Kreutzer, Stephen H. Bach, Alham Fikri Aji
•
May 8, 2025
•
5
1
PlaceIt3D: Размещение объектов в реальных 3D-сценах с использованием языковых инструкций
PlaceIt3D: Language-Guided Object Placement in Real 3D Scenes
Ahmed Abdelreheem, Filippo Aleotti, Jamie Watson, Zawar Qureshi, Abdelrahman Eldesokey, Peter Wonka, Gabriel Brostow, Sara Vicente, Guillermo Garcia-Hernando
•
May 8, 2025
•
5
1
WaterDrum: Водяной знак для метрики удаления данных в центрированных на данных системах
WaterDrum: Watermarking for Data-centric Unlearning Metric
Xinyang Lu, Xinyuan Niu, Gregory Kang Ruey Lau, Bui Thi Cam Nhung, Rachael Hwee Ling Sim, Fanyu Wen, Chuan-Sheng Foo, See-Kiong Ng, Bryan Kian Hsiang Low
•
May 8, 2025
•
5
1
Возвращение ценности в RL: улучшение масштабирования на этапе тестирования через объединение LLM-рассуждающих моделей с верификаторами
Putting the Value Back in RL: Better Test-Time Scaling by Unifying LLM Reasoners With Verifiers
Kusha Sareen, Morgane M Moss, Alessandro Sordoni, Rishabh Agarwal, Arian Hosseini
•
May 7, 2025
•
4
1
BrowseComp-ZH: Оценка способности крупных языковых моделей к веб-серфингу на китайском языке
BrowseComp-ZH: Benchmarking Web Browsing Ability of Large Language Models in Chinese
Peilin Zhou, Bruce Leon, Xiang Ying, Can Zhang, Yifan Shao, Qichen Ye, Dading Chong, Zhiling Jin, Chenxuan Xie, Meng Cao, Yuxin Gu, Sixin Hong, Jing Ren, Jian Chen, Chao Liu, Yining Hua
•
Apr 27, 2025
•
4
1
Модели "Зрение-Язык-Действие": концепции, достижения, применения и вызовы
Vision-Language-Action Models: Concepts, Progress, Applications and Challenges
Ranjan Sapkota, Yang Cao, Konstantinos I. Roumeliotis, Manoj Karkee
•
May 7, 2025
•
3
1
SIMPLEMIX: Удивительно простой способ смешивания данных off-policy и on-policy в обучении языковых моделей на основе предпочтений
SIMPLEMIX: Frustratingly Simple Mixing of Off- and On-policy Data in Language Model Preference Learning
Tianjian Li, Daniel Khashabi
•
May 5, 2025
•
3
1
Токены цепочки рассуждений являются переменными компьютерной программы.
Chain-of-Thought Tokens are Computer Program Variables
Fangwei Zhu, Peiyi Wang, Zhifang Sui
•
May 8, 2025
•
1
1