ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
April 1st, 2025
MoCha: На пути к синтезу говорящих персонажей кинематографического уровня
MoCha: Towards Movie-Grade Talking Character Synthesis
Cong Wei, Bo Sun, Haoyu Ma, Ji Hou, Felix Juefei-Xu, Zecheng He, Xiaoliang Dai, Luxin Zhang, Kunpeng Li, Tingbo Hou, Animesh Sinha, Peter Vajda, Wenhu Chen
•
Mar 30, 2025
•
131
11
TextCrafter: Точное отображение множества текстов в сложных визуальных сценах
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes
Nikai Du, Zhennan Chen, Zhizhou Chen, Shan Gao, Xi Chen, Zhengkai Jiang, Jian Yang, Ying Tai
•
Mar 30, 2025
•
95
3
Open-Reasoner-Zero: Открытый подход к масштабированию обучения с подкреплением на базовой модели
Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model
Jingcheng Hu, Yinmin Zhang, Qi Han, Daxin Jiang, Xiangyu Zhang, Heung-Yeung Shum
•
Mar 31, 2025
•
63
3
Что, Как, Где и Насколько Хорошо? Обзор методов масштабирования во время тестирования в больших языковых моделях
What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models
Qiyuan Zhang, Fuyuan Lyu, Zexu Sun, Lei Wang, Weixu Zhang, Zhihan Guo, Yufei Wang, Irwin King, Xue Liu, Chen Ma
•
Mar 31, 2025
•
53
2
Эффективный вывод для крупных моделей логического рассуждения: обзор
Efficient Inference for Large Reasoning Models: A Survey
Yue Liu, Jiaying Wu, Yufei He, Hongcheng Gao, Hongyu Chen, Baolong Bi, Jiaheng Zhang, Zhiqi Huang, Bryan Hooi
•
Mar 29, 2025
•
46
3
TokenHSI: Унифицированный синтез физического взаимодействия человека и сцены через токенизацию задач
TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization
Liang Pan, Zeshi Yang, Zhiyang Dou, Wenjia Wang, Buzhen Huang, Bo Dai, Taku Komura, Jingbo Wang
•
Mar 25, 2025
•
39
3
Unicorn: Синтез данных на основе текста для обучения моделей обработки визуальной информации и языка
Unicorn: Text-Only Data Synthesis for Vision Language Model Training
Xiaomin Yu, Pengxiang Ding, Wenjie Zhang, Siteng Huang, Songyang Gao, Chengwei Qin, Kejian Wu, Zhaoxin Fan, Ziyue Qiao, Donglin Wang
•
Mar 28, 2025
•
38
2
RIG: Синергия логического мышления и воображения в сквозной универсальной политике
RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy
Zhonghan Zhao, Wenwei Zhang, Haian Huang, Kuikun Liu, Jianfei Gao, Gaoang Wang, Kai Chen
•
Mar 31, 2025
•
30
2
SketchVideo: Генерация и редактирование видео на основе эскизов
SketchVideo: Sketch-based Video Generation and Editing
Feng-Lin Liu, Hongbo Fu, Xintao Wang, Weicai Ye, Pengfei Wan, Di Zhang, Lin Gao
•
Mar 30, 2025
•
23
3
Эффективное управление моделями рассуждений посредством вмешательства в процесс мышления
Effectively Controlling Reasoning Models through Thinking Intervention
Tong Wu, Chong Xiang, Jiachen T. Wang, Prateek Mittal
•
Mar 31, 2025
•
19
4
Расширение возможностей обучения с подкреплением с проверяемыми вознаграждениями в различных областях
Expanding RL with Verifiable Rewards Across Diverse Domains
Yi Su, Dian Yu, Linfeng Song, Juntao Li, Haitao Mi, Zhaopeng Tu, Min Zhang, Dong Yu
•
Mar 31, 2025
•
19
2
Запрос и завоевание: генерация SQL с управлением через выполнение
Query and Conquer: Execution-Guided SQL Generation
Łukasz Borchmann, Marek Wydmuch
•
Mar 31, 2025
•
18
2
Прогрессивное дистилляционное рендеринг: адаптация Stable Diffusion для мгновенного преобразования текста в меш без использования 3D-данных
Progressive Rendering Distillation: Adapting Stable Diffusion for Instant Text-to-Mesh Generation without 3D Data
Zhiyuan Ma, Xinyue Liang, Rongyuan Wu, Xiangyu Zhu, Zhen Lei, Lei Zhang
•
Mar 27, 2025
•
16
2
TeleAntiFraud-28k: Аудио-текстовый набор данных для медленного анализа в целях выявления мошенничества в телекоммуникационной сфере
TeleAntiFraud-28k: A Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection
Zhiming Ma, Peidong Wang, Minhua Huang, Jingpeng Wang, Kai Wu, Xiangzhao Lv, Yachun Pang, Yin Yang, Wenjie Tang, Yuchen Kang
•
Mar 31, 2025
•
12
2
ActionStudio: Облегченная платформа для обработки данных и обучения крупномасштабных моделей действий
ActionStudio: A Lightweight Framework for Data and Training of Large Action Models
Jianguo Zhang, Thai Hoang, Ming Zhu, Zuxin Liu, Shiyu Wang, Tulika Awalgaonkar, Akshara Prabhakar, Haolin Chen, Weiran Yao, Zhiwei Liu, Juntao Tan, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Silvio Savarese, Caiming Xiong
•
Mar 28, 2025
•
12
2
Классическое планирование с эвристиками, генерируемыми LLM: Бросая вызов современным подходам с использованием кода на Python
Classical Planning with LLM-Generated Heuristics: Challenging the State of the Art with Python Code
Augusto B. Corrêa, André G. Pereira, Jendrik Seipp
•
Mar 24, 2025
•
10
1
AvatarArtist: Открытая платформа для 4D-аватаризации
AvatarArtist: Open-Domain 4D Avatarization
Hongyu Liu, Xuan Wang, Ziyu Wan, Yue Ma, Jingye Chen, Yanbo Fan, Yujun Shen, Yibing Song, Qifeng Chen
•
Mar 25, 2025
•
9
2
Easi3R: Оценка разделенного движения из DUSt3R без обучения
Easi3R: Estimating Disentangled Motion from DUSt3R Without Training
Xingyu Chen, Yue Chen, Yuliang Xiu, Andreas Geiger, Anpei Chen
•
Mar 31, 2025
•
7
2
MeshCraft: Исследование эффективного и управляемого генерации сеток с помощью потоковых диффузионных трансформеров
MeshCraft: Exploring Efficient and Controllable Mesh Generation with Flow-based DiTs
Xianglong He, Junyi Chen, Di Huang, Zexiang Liu, Xiaoshui Huang, Wanli Ouyang, Chun Yuan, Yangguang Li
•
Mar 29, 2025
•
7
2
DSO: Согласование 3D-генераторов с обратной связью от симуляции для обеспечения физической корректности
DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness
Ruining Li, Chuanxia Zheng, Christian Rupprecht, Andrea Vedaldi
•
Mar 28, 2025
•
6
2
UPME: Беспристрастная система оценки мультимодальных крупных языковых моделей на основе взаимного рецензирования
UPME: An Unsupervised Peer Review Framework for Multimodal Large Language Model Evaluation
Qihui Zhang, Munan Ning, Zheyuan Liu, Yanbo Wang, Jiayi Ye, Yue Huang, Shuo Yang, Xiao Chen, Yibing Song, Li Yuan
•
Mar 19, 2025
•
6
2
Энтропийно-адаптивное взвешивание для самообучения
Entropy-Based Adaptive Weighting for Self-Training
Xiaoxuan Wang, Yihe Deng, Mingyu Derek Ma, Wei Wang
•
Mar 31, 2025
•
4
2
KOFFVQA: Объективно оцениваемый эталонный тест для свободного визуального вопроса-ответа на корейском языке для крупных моделей обработки зрения и языка
KOFFVQA: An Objectively Evaluated Free-form VQA Benchmark for Large Vision-Language Models in the Korean Language
Yoonshik Kim, Jaeyoon Jung
•
Mar 31, 2025
•
4
2
Соединение эволюционной многокритериальной оптимизации и ускорения на GPU через тензоризацию
Bridging Evolutionary Multiobjective Optimization and GPU Acceleration via Tensorization
Zhenyu Liang, Hao Li, Naiwei Yu, Kebin Sun, Ran Cheng
•
Mar 26, 2025
•
4
3
PAVE: Патчинг и адаптация видеомоделей большого языка
PAVE: Patching and Adapting Video Large Language Models
Zhuoming Liu, Yiquan Li, Khoi Duc Nguyen, Yiwu Zhong, Yin Li
•
Mar 25, 2025
•
4
2
Разделение углов и силы в низкоранговой адаптации
Decoupling Angles and Strength in Low-rank Adaptation
Massimo Bini, Leander Girrbach, Zeynep Akata
•
Mar 23, 2025
•
4
2
Понимание сопутствующих речи жестов в естественных условиях
Understanding Co-speech Gestures in-the-wild
Sindhu B Hegde, K R Prajwal, Taein Kwon, Andrew Zisserman
•
Mar 28, 2025
•
1
2