ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
April 22nd, 2025
EasyEdit2: Простая в использовании система управления для редактирования больших языковых моделей
EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models
Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
•
Apr 21, 2025
•
21
2
LeetCodeDataset: Временной набор данных для надежной оценки и эффективного обучения языковых моделей для работы с кодом
LeetCodeDataset: A Temporal Dataset for Robust Evaluation and Efficient Training of Code LLMs
Yunhui Xia, Wei Shen, Yan Wang, Jason Klein Liu, Huifeng Sun, Siyue Wu, Jian Hu, Xiaolong Xu
•
Apr 20, 2025
•
19
2
Взгляд с другой стороны: оценка понимания многопользовательского представления в MLLM
Seeing from Another Perspective: Evaluating Multi-View Understanding in MLLMs
Chun-Hsiao Yeh, Chenyu Wang, Shengbang Tong, Ta-Ying Cheng, Rouyu Wang, Tianzhe Chu, Yuexiang Zhai, Yubei Chen, Shenghua Gao, Yi Ma
•
Apr 21, 2025
•
22
2
InfiGUI-R1: Развитие мультимодальных GUI-агентов от реактивных исполнителей до обдумывающих систем
InfiGUI-R1: Advancing Multimodal GUI Agents from Reactive Actors to Deliberative Reasoners
Yuhang Liu, Pengxiang Li, Congkai Xie, Xavier Hu, Xiaotian Han, Shengyu Zhang, Hongxia Yang, Fei Wu
•
Apr 19, 2025
•
13
2
LoftUp: Обучение координатно-ориентированного апсемплера признаков для базовых моделей компьютерного зрения
LoftUp: Learning a Coordinate-Based Feature Upsampler for Vision Foundation Models
Haiwen Huang, Anpei Chen, Volodymyr Havrylov, Andreas Geiger, Dan Zhang
•
Apr 18, 2025
•
4
2
RF-DETR для обнаружения объектов против YOLOv12: исследование архитектур на основе трансформеров и сверточных нейронных сетей для обнаружения зеленых плодов в условиях сложной среды сада при неоднозначности меток в задачах с одним и несколькими классами
RF-DETR Object Detection vs YOLOv12 : A Study of Transformer-based and CNN-based Architectures for Single-Class and Multi-Class Greenfruit Detection in Complex Orchard Environments Under Label Ambiguity
Ranjan Sapkota, Rahul Harsha Cheppally, Ajay Sharda, Manoj Karkee
•
Apr 17, 2025
•
4
2
FlowReasoner: Усиление мета-агентов на уровне запросов
FlowReasoner: Reinforcing Query-Level Meta-Agents
Hongcheng Gao, Yue Liu, Yufei He, Longxu Dou, Chao Du, Zhijie Deng, Bryan Hooi, Min Lin, Tianyu Pang
•
Apr 21, 2025
•
46
2
SilVar-Med: Речевая визуальная языковая модель для объяснимого обнаружения аномалий в медицинских изображениях
SilVar-Med: A Speech-Driven Visual Language Model for Explainable Abnormality Detection in Medical Imaging
Tan-Hanh Pham, Chris Ngo, Trong-Duong Bui, Minh Luu Quang, Tan-Huong Pham, Truong-Son Hy
•
Apr 14, 2025
•
2
2
NEMOTRON-CROSSTHINK: Масштабирование самообучения за пределы математических рассуждений
NEMOTRON-CROSSTHINK: Scaling Self-Learning beyond Math Reasoning
Syeda Nahida Akter, Shrimai Prabhumoye, Matvei Novikov, Seungju Han, Ying Lin, Evelina Bakhturi, Eric Nyberg, Yejin Choi, Mostofa Patwary, Mohammad Shoeybi, Bryan Catanzaro
•
Apr 15, 2025
•
6
4
Eagle 2.5: Улучшение посттренировки для моделей с длинным контекстом в передовых моделях обработки зрения и языка
Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models
Guo Chen, Zhiqi Li, Shihao Wang, Jindong Jiang, Yicheng Liu, Lidong Lu, De-An Huang, Wonmin Byeon, Matthieu Le, Tuomas Rintamaki, Tyler Poon, Max Ehrlich, Tuomas Rintamaki, Tyler Poon, Tong Lu, Limin Wang, Bryan Catanzaro, Jan Kautz, Andrew Tao, Zhiding Yu, Guilin Liu
•
Apr 21, 2025
•
65
5
ToolRL: Награда — это всё, что нужно для обучения работе с инструментами
ToolRL: Reward is All Tool Learning Needs
Cheng Qian, Emre Can Acikgoz, Qi He, Hongru Wang, Xiusi Chen, Dilek Hakkani-Tür, Gokhan Tur, Heng Ji
•
Apr 16, 2025
•
41
2
DRAGON: Оптимизация генеративных диффузионных моделей с помощью распределенных наград
DRAGON: Distributional Rewards Optimize Diffusion Generative Models
Yatong Bai, Jonah Casebeer, Somayeh Sojoudi, Nicholas J. Bryan
•
Apr 21, 2025
•
10
2
THOUGHTTERMINATOR: Бенчмаркинг, калибровка и смягчение чрезмерного анализа в моделях рассуждений
THOUGHTTERMINATOR: Benchmarking, Calibrating, and Mitigating Overthinking in Reasoning Models
Xiao Pu, Michael Saxon, Wenyue Hua, William Yang Wang
•
Apr 17, 2025
•
24
2
Бросьте кости и оглянитесь перед прыжком: Выход за пределы творческих ограничений предсказания следующего токена
Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction
Vaishnavh Nagarajan, Chen Henry Wu, Charles Ding, Aditi Raghunathan
•
Apr 21, 2025
•
2
2
Обучение рассуждениям с использованием внеполитического руководства
Learning to Reason under Off-Policy Guidance
Jianhao Yan, Yafu Li, Zican Hu, Zhi Wang, Ganqu Cui, Xiaoye Qu, Yu Cheng, Yue Zhang
•
Apr 21, 2025
•
77
4
RainbowPlus: Улучшение генерации адверсарных промптов с помощью эволюционного поиска в пространстве качественного разнообразия
RainbowPlus: Enhancing Adversarial Prompt Generation via Evolutionary Quality-Diversity Search
Quy-Anh Dang, Chris Ngo, Truong-Son Hy
•
Apr 21, 2025
•
6
8
LMM для эффективного понимания видео через усиленное сжатие видеокубов
An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes
Ji Qi, Yuan Yao, Yushi Bai, Bin Xu, Juanzi Li, Zhiyuan Liu, Tat-Seng Chua
•
Apr 21, 2025
•
10
3
LookingGlass: Генеративные анаморфозы с использованием деформации через лапласову пирамиду
LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping
Pascal Chang, Sergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo
•
Apr 11, 2025
•
8
6
X-Teaming: Многоходовые атаки на защиту и методы противодействия с использованием адаптивных мультиагентных систем
X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents
Salman Rahman, Liwei Jiang, James Shiffer, Genglin Liu, Sheriff Issaka, Md Rizwan Parvez, Hamid Palangi, Kai-Wei Chang, Yejin Choi, Saadia Gabriel
•
Apr 15, 2025
•
30
2
OTC: Оптимальные вызовы инструментов с использованием обучения с подкреплением
OTC: Optimal Tool Calls via Reinforcement Learning
Hongru Wang, Cheng Qian, Wanjun Zhong, Xiusi Chen, Jiahao Qiu, Shijue Huang, Bowen Jin, Mengdi Wang, Kam-Fai Wong, Heng Ji
•
Apr 21, 2025
•
33
2
SphereDiff: Беспараметрическая генерация панорамных изображений и видео с полным обзором через сферическое латентное представление
SphereDiff: Tuning-free Omnidirectional Panoramic Image and Video Generation via Spherical Latent Representation
Minho Park, Taewoong Kang, Jooyeol Yun, Sungwon Hwang, Jaegul Choo
•
Apr 19, 2025
•
28
2
CoMotion: Совместное многопользовательское 3D-движение
CoMotion: Concurrent Multi-person 3D Motion
Alejandro Newell, Peiyun Hu, Lahav Lipson, Stephan R. Richter, Vladlen Koltun
•
Apr 16, 2025
•
3
2
UFO2: Агентная операционная система для настольных компьютеров
UFO2: The Desktop AgentOS
Chaoyun Zhang, He Huang, Chiming Ni, Jian Mu, Si Qin, Shilin He, Lu Wang, Fangkai Yang, Pu Zhao, Chao Du, Liqun Li, Yu Kang, Zhao Jiang, Suzhen Zheng, Rujia Wang, Jiaxu Qian, Minghua Ma, Jian-Guang Lou, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang
•
Apr 20, 2025
•
27
3
Uni3C: Унификация точного 3D-улучшенного управления камерой и движениями человека для генерации видео
Uni3C: Unifying Precisely 3D-Enhanced Camera and Human Motion Controls for Video Generation
Chenjie Cao, Jingkai Zhou, Shikai Li, Jingyun Liang, Chaohui Yu, Fan Wang, Xiangyang Xue, Yanwei Fu
•
Apr 21, 2025
•
18
2
TAPIP3D: Отслеживание любой точки в устойчивой 3D-геометрии
TAPIP3D: Tracking Any Point in Persistent 3D Geometry
Bowei Zhang, Lei Ke, Adam W. Harley, Katerina Fragkiadaki
•
Apr 20, 2025
•
7
2
LearnAct: Мобильный агент для графического интерфейса с обучением на нескольких примерах и унифицированным бенчмарком демонстраций
LearnAct: Few-Shot Mobile GUI Agent with a Unified Demonstration Benchmark
Guangyi Liu, Pengxiang Zhao, Liang Liu, Zhiming Chen, Yuxiang Chai, Shuai Ren, Hao Wang, Shibo He, Wenchao Meng
•
Apr 18, 2025
•
11
2
StyleMe3D: Стилизация с разделенными априорными знаниями с использованием множества энкодеров на 3D-гаусссианах
StyleMe3D: Stylization with Disentangled Priors by Multiple Encoders on 3D Gaussians
Cailin Zhuang, Yaoqi Hu, Xuanyang Zhang, Wei Cheng, Jiacheng Bao, Shengqi Liu, Yiying Yang, Xianfang Zeng, Gang Yu, Ming Li
•
Apr 21, 2025
•
23
2
PROMPTEVALS: Набор данных утверждений и защитных механизмов для кастомизированных производственных конвейеров больших языковых моделей
PROMPTEVALS: A Dataset of Assertions and Guardrails for Custom Production Large Language Model Pipelines
Reya Vir, Shreya Shankar, Harrison Chase, Will Fu-Hinthorn, Aditya Parameswaran
•
Apr 20, 2025
•
4
2